加州理工学院研究人员声称可对高保真AI模型进行颠覆性压缩

admin8小时前北京天气2

  加州理工学院的电脑科学家兼数学家巴巴克·哈西比(Babak Hassibi)领导的一个研究团队表示,他们已经创建了一款大语言模型,可以在不影响性能的情况下大幅压缩模型大小。

  这家名为PrismML的公司周二结束隐身模式,并将其1-bit技术模型开源,供他人使用。

  哈西比表示,PrismML开发了一种极致的压缩技术,既能让AI在手机、笔记本电脑和其他设备上本地运行,也能助力数据中心的建设,使其能用更少的资源完成更多任务,并避免能源成本的急剧膨胀。

  该公司的首席执行官哈西比说:“我们花费了数年时间来发展压缩神经网络而不损失其推理能力所需的数学理论。”他还说:“我们正在为AI创造一种新的范式:一种能够适应不同硬件环境,并在每单位计算和能源下提供最大智能的范式。”

  其他同样来自加州理工学院的联合创始人包括萨欣·拉莱(Sahin Lale)、奥米德·普拉赞迪(Omead Pooladzandi)和雷扎·萨德里(Reza Sadri),后者同时也是公司战略副总裁。

  哈西比说,该知识产权归加州理工学院所有,PrismML是唯一的独家被许可方。

  该公司在SAFE和种子轮融资中筹集了1625万美元,投资者包括Khosla Ventures、Cerberus Capital和加州理工学院。SAFE即未来股权简单协议(Simple Agreement for Future Equity),指投资者向初创公司提供资金,以换取未来获得股权的权利。

  投资人维诺德·科斯拉(Vinod Khosla)认为,AI的未来不由谁能建起最大的数据中心来定义,而是由谁能在每单位能源和成本下提供最大的智能来决定。科斯拉说:“所以这并非一次小小的迭代,而是一项重大的技术突破。这是一项数学上的突破,而不仅仅是又一个小模型。”

  科斯拉说,PrismML满足了市场对快速、小巧但高性能模型的需求,这些模型可服务于从语音对话到金融某些领域的广泛应用。

  PrismML开发的模型旨在智能手机和笔记本电脑等消费设备以及工业边缘设备上运行。该公司表示,其理念是让机器人、可穿戴设备和个人计算等领域的应用成为可能,而这些应用在以前是不切实际的。

  科斯拉说:“你可以在手机上装下一个好得多的模型。这一点意义重大。当然,在手机或移动设备上,能耗是一个非常、非常重要的问题。”

  PrismML表示,同样的效率提升不仅能实现本地部署,还能让数据中心更有效地运行。

  哈西比称,尽管更广泛的科技行业在激烈辩论AI的未来在于Transformer、扩散模型还是更新的概念,但PrismML的数学框架可以应用于其中任何一种。

  运作原理

  描述AI模型的一种方式是使用“比特”(bit),它指的是用计算机语言“1”和“0”来表示一个数值所需的代码量。大多数AI模型以16-bit的精度编写,不过也有些方法采用4-bit或更低精度。据哈西比称,PrismML取得了一项数学突破,实现了1-bit模型,且不影响全精度模型的推理、编码和通用知识能力。哈西比表示,虽然相关数学原理是专有技术,但其效果很像在不损失视觉保真度的情况下压缩数码照片。

  在运行AI模型时,被称为“延迟”的延时和能耗都与内存中数据的移入移出有关。哈西比说,通过将数据单位(即模型权重)减少到用+1或-1表示的单个比特,PrismML的旗舰1-bit模型Bonsai 8B的处理速度可比16-bit模型提高多达八倍。哈西比还说,在现有硬件平台上,该模型还能将能耗降低最多75%至80%。他表示,如果未来的硬件专为1-bit模型设计,将完全无需进行复杂的数学乘法运算。哈西比认为,届时硬件将只需执行简单的加减法,这将进一步降低能耗和延迟。

  Cerberus Capital Management的高级董事总经理阿米尔·萨莱克(Amir Salek)表示,他确信PrismML取得了一项重大的数学突破,有望改善AI的经济效益。

  PrismML称,采用1-bit架构后,一个2TB的模型会瞬间变成150GB。萨莱克说:“你的带宽需求会大幅下降,内存大小会大幅下降,移动数据所消耗的能量……也会大幅减少。”他曾是谷歌技术基础设施和Google Cloud业务的创始人兼芯片负责人。在此之前,他还是英伟达片上系统(System-on-a-Chip)设计部门的创始人和负责人。

  开发者、研究人员和其他用户可以免费下载PrismML开源的1-bit模型Bonsai 8B。

  Bonsai 8B是一款80亿参数的大语言模型,使用谷歌v4 TPU进行训练。

  据PrismML称,该模型实现了可与16-bit模型相媲美的高保真推理和语言理解能力,但内存占用仅为1GB,而后者为16GB。高保真推理是指成功执行复杂推理的能力。

  该公司表示,还将发布1-bit的Bonsai 40亿参数模型和17亿参数模型,其内存占用分别为0.5GB和0.24GB,且智能密度更高。

相关文章

爱依服登黑猫投诉2025年服饰榜黑榜:爱依服裤子只穿一次起球商家称正常

爱依服登黑猫投诉2025年服饰榜黑榜:爱依服裤子只穿一次起球商家称正常

专题:提升消费品质——聚焦2026 “315晚会”   一年一度国际消费者权益日即将到来,为提振消费信心,推动消费者权益保护协同共治,打造更加安全放心消费环境,新浪财经联合黑猫投诉 【下载黑猫投诉客户...

重庆市市长胡衡华被查!

重庆市市长胡衡华被查!

  重庆市委副书记、市长胡衡华接受中央纪委国家监委纪律审查和监察调查。   据中央纪委国家监委网站消息,重庆市委副书记、市长胡衡华涉嫌严重违纪违法,目前正接受中央纪委国家监委纪律审查和监察调查。  ...

城农商行自营私募债、ABS投资或收紧

“资产荒”困境之下,部分机构投资相对高收益的交易所私募债、ABS的情况不少,城农商行即为其一。 不过,城农商行的上述投资行为,受到近期部分地方的监管部门问询相关消息的惊扰,消息称城农商行自营私募债、A...

如何克服内卷,林毅夫支招

专题:博鳌亚洲论坛2026年年会   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   3月24日消息,博鳌亚洲论坛2026年年会于3月24日至27日在海南博鳌举行。在“中...

疯狂亏损,广发百亿基金经理郑澄然“翻车”!

疯狂亏损,广发百亿基金经理郑澄然“翻车”!

  来源:资市会   卸任前在管8只基金,5年合计亏损超150亿元。   作者|资市分子   广发基金再现百亿基金经理卸任,这次主角是郑澄然。   3月18日,广发基金公告显示,因工作安排,郑澄然卸...

英国公布光纤宽带普及最后阶段的实施规则

  英国周二表示,将对英国电信旗下Openreach全国宽带网络再实施五年监管,并对更广泛的网速设置价格上限,以推动市场竞争,并将光纤连接覆盖至该国最后五分之一的场所。   由英国通讯管理局在2021...