,,

大模型讓讓，小模型登場丨科創(chuàng)要聞

來源: 發(fā)表時間:2025-04-17 04:05:13

4 月 23 日，大模登場微軟推出小語言模型（SLM）Phi-3系列，型讓有Phi-3-mini、模型Phi-3-small、丨科Phi-3-medium三個版本，創(chuàng)聞在評估語言、大模登場編程、型讓數(shù)學能力等的模型基準測試中，Phi-3系列模型表現(xiàn)優(yōu)于同等規(guī)模甚至更大規(guī)模模型（如GPT-3,丨科5）。微軟稱其是創(chuàng)聞目前同類中最強大且最具成本效益的小型語言模型。

Phi-3模型的大模登場“小體積”，讓手機上運行高能力的型讓語言模型成為可能。如Phi-3-mini只占用手機18GB內存，模型如在iPhone 14上部署，丨科蘋果的創(chuàng)聞A16仿生芯片在設備上脫機運行，可以實現(xiàn)每秒超過12個token。

自2022年12月ChatGPT爆火之后，科技公司們一頭扎進了大型模型的競爭，2023年接連刷新模型參數(shù)，2024年開始“內卷”長文本。大家似乎默認數(shù)據(jù)越多、參數(shù)越大、算力越強，模型的能力越強。

但是，高昂的運行成本、具體場景模型調試難度等問題，讓大模型商業(yè)化的路徑慢下來。此時小模型的優(yōu)勢就體現(xiàn)出來了。

小模型，目前某些領域也能接近大模型的性能。特別是在各手機和PC廠商正在力推的AIPC、AI手機上，對設備計算能力、運行能力、儲存能力要求較低，能在地化運行的小模型，的確是不錯的選擇。

其實早在2023年6月份，微軟就發(fā)布了第一代Phi模型，Phi-3系列已經(jīng)是其第四代產(chǎn)品。近期，蘋果公司也湊了小模型的熱鬧。

2024年4月24日，在大模型上沒有什么動靜的蘋果公司，發(fā)布開源小語言模型OpenELM，包括

相關欄目：焦點

.重點關注

美國新墨西哥州發(fā)生槍擊事件
2025-04-17 03:47
上半年2003名紀檢干部被處分，廳局級95人丨時政周報
2025-04-17 03:30
針對“一高校在讀學生舉報其導師涉嫌違法”，北京警方已依法介入調查
2025-04-17 03:08
中國游客1死5傷，坦桑尼亞游獵之旅的浪漫與風險
2025-04-17 02:56
《平原上的火焰》：被放大的憤怒，被忽略的敘述
2025-04-17 02:54
外交部：《北京宣言》為巴勒斯坦人民帶來了寶貴希望
2025-04-17 02:53

超碰97人人模-超碰97人人人人人蜜桃-超碰97无码-超碰97资源共享-超碰97资源人人妻人人-超碰福利导航

大模型讓讓，小模型登場丨科創(chuàng)要聞

.重點關注