站長之家(ChinaZ.com) 11月30日 消息:深度求索發(fā)布了一個67B 的大模型,名為 DeepSeek LLM67B。這個模型完全開源,可以通過訪問 chat.deepseek.com 來使用。
DeepSeek LLM67B 在公開評測榜單上表現(xiàn)良好,特別是在推理、數(shù)學(xué)和編程能力方面。DeepSeek 還開源了7B 和67B 的兩種規(guī)模的模型,并提供了9個訓(xùn)練中途的模型 checkpoints 的下載。
DeepSeek LLM67B 在數(shù)學(xué)和指令跟隨的測試中表現(xiàn)出色,并在 LeetCode 周賽中遙遙領(lǐng)先。最后,在開放域推理的測試中,DeepSeek LLM67B 展現(xiàn)出了較好的表現(xiàn)。
Hugging Face 首頁:https://huggingface.co/deepseek-ai
GitHub 倉庫:https://github.com/deepseek-ai/DeepSeek-LLM
(舉報)