发布日期:2025-02-15 浏览次数:
毫无疑问,Deepseek是当下最亮的那颗星。连篇累牍的报道已经汗牛充栋。
我作为AI行业的边缘人——MCU芯片只能算是AI应用领域的边缘外围,从我的观察来分享一些个人看法和预测。
芯片行业最重要的定律,由1965年英特尔创始人摩尔提出,成为半导体技术最著名的发展规律,大意是集成电路上可容纳的晶体管数目大约每隔 18-24 个月便会增加一倍,性能也将提升一倍,而价格却保持不变。
2000年的时候,我在电信做互联网骨干网的项目,记得当时采购EMC的磁盘阵列就花了200万美元,总容量不过4T,而今天一个普通的硬盘容量都远远超过这个规格了。当时家庭拨号上网的Modem速率是28.8kbps,下载个图片都费劲,现在家庭宽带光纤入户,已经没有人关心速率到底是多少了。
Deepseek印证了,在AI算力领域,似乎也符合摩尔定律。即人工智能的算力成本会迅速降低,性能将不断提升。
看了最新的Cathie Wood采访,木头姐说,在DeepSeek之前,人工智能训练成本每年下降75%,推理成本甚至下降85%到90%。
如果 AI 训练成本的下降趋势是 每年 4 倍,如果 DeepSeek-V3 的训练成本比一年前开发的美国当前模型低约 8 倍,那其实完全符合正常趋势。
仅靠行业的正常发展,2024 年训练一个模型的成本,理应比 2023 年低 3 到 4 倍。同时,训练成本的下降也带动了推理成本的下降。比如,Claude 3.5 Sonnet 相较 GPT-4 晚了 15 个月发布,但几乎在所有基准测试中都胜出,同时 API 价格也下降了 约 10 倍。
按照这个趋势走下去,那么大模型的收费商业模型似乎很难成立,OpenAI那个200美元的月费服务很快流产就是明证。大模型之间的内卷竞争加速,意味着大模型未来必然是免费的。
大模型和算力作为基础架构,有点像运营商的带宽建设,最终会近乎免费。想起互联网初代的时候,电子邮箱也需要会员收费服务,后来就没有后来了。
当某个行业成为热点后,必然会有大量风险投资乃至传统资金蜂拥而入,导致行业出现大批无序竞争者,最后经过一系列竞争整合,最终行业会整合到1-3家头部企业中,但即使是行业No1也很有可能走不到最后。
比如说百团大战,硝烟散尽现在美团一家独大,当初曾领跑的团购独角兽们比如糯米团、拉手、F团等已经消失无踪,其他几百家团都已成为炮灰。网约车和共享单车大战,也是一样的结果。
行业赛道处于快速迭代过程中的时候,领先者往往没有太多护城河可以防守,技术快速演进时很容易被突然冒出的意外事件打垮,当年网络视频网站流量前三位除了优酷土豆外还有一家56,结果在一夜之间被黑垮掉。
OpenAI目前虽然还暂时没有对手,但是能不能存活到最后我看并没有把握。
还有一种情况是整个热门赛道被全灭,某个热门技术方向突然不成立了,比如某个投资机构押注元宇宙赛道,八年前All in了所有的VR头盔厂家,结果可想而知,自己都成为了时代的浪花。
AI大模型赛道,国内有名有姓的厂商也已超过百家,头部的五六家格局渐渐形成,Deepseek异军突起,其实是远超业内业外人士的预见的,之前没有投资机构关注DS,就是证明。技术快速变化的时候,不管是OpenAI,还是Sora,还是Deepseek,都可能只有三分钟热度。
没有投资机构裹挟的Deepseek能走出来,也说明在无脑机构热钱喂出来的公司,往往反而会动作走样,为了迎合资本做出错误的决策。
根据杰文斯悖论,当某种资源的使用效率提高后,虽然单次使用时消耗更少,但因为成本降低、欧博体育下载使用更方便,反而可能让人们用得更多,导致整体消耗量反而上升。
Anthropic 的CEO认为各公司在训练强大的AI模型上的投入不断增加,尽管成本曲线会周期性下移,训练特定智能水平模型的成本也在迅速下降。然而节省下来的成本又被投入到使用相同巨额预算开发更智能的模型中。
Deepseek短期看似乎降低了市场对算力的需求,但是中长期看成本降低后大量新应用出现,对算力的需求会指数级激增。
电脑、手机和互联网的发展历史基本上都是这么过来的,硬件和应用相互刺激,市场迅速扩大,欧博体育下载用户普及下沉,增量市场蛋糕出现,比如前几年手机资费增速降费后,智能手机普及下乡,PDD和某音迅速从三四线城市和农村崛起,续写了当年淘宝弯道超车易趣的历史。
C端市场里的消费电子(智能眼镜)、人形机器人、智能驾驶确实是主流看法,但我更看好B端应用市场,主要原因是C端全部被互联网巨头和终端巨头卡位了,其他公司进入的机会基本上被封死了。
推理成本降低将带来极大的利好。推理成本的降低意味着企业能够更高效、更经济地部署AI模型,而无需承担昂贵的训练成本。因此,那些专注于AI推理的公司——例如云计算服务提供商、边缘计算公司,以及AI应用企业——都可能迎来强劲的市场需求增长。
有了AI算力支撑,所有的政府机构和企业都需要对所有工作流程进行重组,以提升效率和降低成本。PLTR的模式已经走在了前面,从Palantir的业务来说,目前主要是超大B端客户,前20大客户占了40%的营收,最小的客户也要200万美金,业务属性有30%偏向定制化服务。大型企业先行,中小企业跟进,未来会出现更多针对行业客户的AI应用。
AI流程重组应该算是第四次企业流程重组浪潮,之前三次流程重组风口分别是:
IOE是三个国外大的厂商的缩写,I是IBM ,O是Oracle,E是EMC。当初所有的IT的基础建设几乎都是由这3家公司来提供的。阿里巴巴首先提出逐步去除对IBM小型机、Oracle数据库及EMC存储设备的依赖,取而代之的是成本更低、更灵活的X86服务器和开源软件解决方案,从而实现技术自主、成本控制和系统架构的优化。
国外去IOE的鼻祖是谷歌,谷歌自己起家的数据中心里,几乎都是自己组装的X86服务器和自研廉价设备和开源系统。
开源的Deepseek降低了企业部署AI基础设施的成本和技术门槛,对于普及企业AI应用将是很大的助力,也可以通过自研和国产替代,去掉传统的产品模式,变成彻底灵活的互联网服务模式。意味着哪怕用一堆破设备,哪怕没有顶尖的英伟达GPU,也可以自己DIY取胜。
开源vs闭源,通过开源迅速打开市占率,Deepseek不会是最后一个,与企业倾向于部署私有云的需求不谋而合。
产业链是残酷的,通行的法则是谁占主导地位,谁吞噬利润。最典型的例子是果链,苹果吃掉了最多的利润,当然苹果的供应商也得到了合理的利润,相比而言给其他品牌手机供货的供应商就更惨了点。
相应的供应链还有汽车(新势力)、电池(宁德)、PC(联想)、小家电(小米),服务和内容行业的供应链有电商(阿里)、游戏(腾讯)、视频(抖音)、音乐(腾讯)等。在AI整个供应链上,目前英伟达占据主导地位,但是随着应用的崛起,是否会让出主导地位只是迟早的事情。
至于在AI整个供应链上,英伟达及其上游台积电、下游服务器(配件如CPO、液冷等)、大模型、行业应用平台、边缘侧设备、集成商,谁主沉浮,就看谁更稀缺,谁更能抓住客户了。
最近几天,各行各业都在宣布争相接入Deepseek,生怕错过了这班车。正好蹭一下热度,我司AG32 MCU采用的开发工具是开源的VSCode,已经实现通过插件方式接入Deepseek进行辅助开发编程,实现代码的补全、生成、查错和对话等功能,甚至可以通过我们官方提供的例程来生成需要的代码,提升编程效率。
2024年也被称为MCU的AI元年,将边缘AI技术融入MCU是各家厂商都在关注的话题。
边缘AI技术可以使MCU兼顾更高性能的数据处理任务,实现实时决策功能。例如,在智能工控领域,需要系统执行太阳能和储能系统中的电弧故障检测,以及用于预测性维护的电机轴承故障检测等功能,边缘AI帮助MCU对设备和传感器收集的数据进行实时分析和处理,提供更准确的决策,使系统实现更高的故障检测准确率。
以上这些应用肯定不是AI MCU应用的全部,只不过是欧洲MCU大厂以其贫乏的想象力所能想到的一些有限场景。未来的MCU AI创新应用一定会在中国大放异彩并让欧美原厂大跌眼镜。
物联网、边缘计算等应用场景对MCU性能要求的不断攀升,需要MCU在有限的功耗预算内实现高性能计算。MCU自身计算资源与存储空间受限,实现高算力 AI功能更是难上加难。轻量级AI框架才是MCU需要的技术,螺蛳壳里做道场,能否做出适合边缘推理的类似Deepseek这样节省算力和功耗的算力模型,可能是AI MCU能否跑出来的关键点。
跟训练市场相比,LoT终端的边缘推理需求的数量级大得多得多(百亿朝上),MCU作为不起眼的小器件,承担的是最后一米的活儿,可以称得上是蚂蚁雄兵,也许市场还未关注到这一步,但是早晚会发生。返回搜狐,查看更多