文 丨 新浪科技 周文猛
Kimi爆火,国产大模型突然开始“卷”长文本。
接连两日,阿里巴巴、360等互联网大厂相继官宣1000万字、500万字的长文本处理能力,另有消息称,百度也将开放长文本能力,文字范围会在200万字-500万字。
一场围绕着Kimi的“围剿战”正在上演。
在上述已经官宣具备长文本能力的三款明星产品上,就目前公测版本而言,新浪科技分别做了三个样本试验:在总结《三体2:黑暗森林》和《未来简史》时,Kimi只能解读52%和66%文本内容,而另两家分别达到100%解读。这也意味着,在最常见的解读小说、畅销书环节,目前Kimi并没有优势,甚至在某些功能上与大厂大模型仍有差距。
有AI大模型行业投资人向新浪科技直言,“长文本在技术圈里并不稀奇,并没有想象中那么难”。此前受限于长文本对算力消耗极大且成本较高,导致入局者较少,“资本关注,现在不得不入局开卷”。
此外他透露,目前Kimi投放广告的获客成本约在10元,如果算上拉新后用户问答互动产生的算力成本,每个用户的获客成本达到12-13元。根据第三方平台的下载量预估,近一个月来,Kimi在苹果端和Android/ target=_blank class=infotextkey>安卓端的日均下载量为17805。按此计算,Kimi每天的获客成本将烧掉至少20万元。
长文本解析,哪家强?
事实上,长文本处理这项技术也许并不稀缺。在短时间内,阿里和360相继宣布开放这一功能,就可佐证。
根据阿里巴巴官方消息,阿里通义千问向所有人免费开放1000万字的长文档处理功能,成为全球文档处理容量第一的AI应用。几小时后,360宣布智脑正式内测500万字长文本处理功能,该功能入驻360AI浏览器。
就目前公测版本而言,Kimi、360、阿里,谁的长文本处理能力更强?新浪科技分别进行了三组试验:
样本一:畅销书《未来简史》;
样本二:畅销书《三体2:黑暗森林》;
样本三:Sora英文论文《大型视觉模型背景、技术、局限性和机遇综述》。
(Kimi总结《三体2:黑暗森林》,只能阅读52%)
(通义千问总结《三体2:黑暗森林》)
(360浏览器AI助手总结《三体2:黑暗森林》)
简要总结:在实验一和实验二中,Kimi仅能解读前两者52%和66%文本内容,从文本解读的完成度上明显落后两者;解析内容层面,三者都有各自的总结,360增设了摘要和思维导图等能力。
此外,在联网搜索等方面,Kimi所展现出的能力也存在一定局限。
引爆A股,有何过人之处?
不过毫无疑问的是,“月之暗面”仍然是当下最炙手可热的AI企业。从资方背景来看,包括阿里、红杉中国、小红书、美团等在内的顶级互联网巨头加持,更是让这家刚A轮的AI科技企业,增添了许多神秘。
除了头部互联网产业资本一直看好外,目前月之暗面备受关注还有三方面原因:
第一,公司创始团队年轻且富才学。公司创始人杨植麟为中国35岁以下NLP领域引用最高的研究者,Transformer-XL和X.NET两篇论文的第一作者,两者均为大语言模型领域的核心技术。公司另外两位联合创始人周昕宇和吴育昕也在大模型道路上探索多年。
第二,Kimi作为一款由初创企业打造的产品,快速获得了市场关注,日活不断逼近豆包、文心一言等大厂产品。据华福AI互联网团队公布数据,截至今年3月3日,Kimi小程序+网页+App用户日活90.38万人,相较于豆包网页+App日活268万人,和文心一言网页+App日活233万人,差距正不断缩小。
第三,去年10月,Kimi发布时仅能够支持20万字的无损上下文输入,但半年后,公司近期再次宣布内测支持200万字的无损上下文输入能力,短期内文本处理能力提升10倍,技术迭代进展飞快。
一系列“振奋人心”的消息冲击下,Kimi俨然成为ChatGPT之后国内最值得关注的现象级AI产品,因此也迎来了A股市场的热捧。近日,A股与Kimi存在关联关系的华策影视、掌阅科技、中广天择、海天瑞声等多只个股涨停。
然而,Kimi的技术突破,与A股市场Kimi关联企业的市值暴涨真的存在关联吗?答案也许是否定的。
在与新浪科技沟通中,便有金融行业从业者表示,Kimi概念股暴涨,“本质就是股市炒概念的套路,没有太多底层逻辑性。”在他看来,“券商研究员基本的操作就是找热点,然后把一些消息释放出去,让散户抄起来,然后机构退出赚钱,自己则从中获得对冲基金的派点,就是这么一个逻辑。”
对于Kimi所擅长的长文本处理能力,另有某国内知名大模型创企投资人李良(化名)对新浪科技表示,“长文本这个东西在技术圈并不稀奇,大家想做就能做。”但为什么大家都不做呢?李良的解释是,“最根本的原因还是长文本对算力消耗极大,成本太高了,目前入局也是不得已的选择”。
大模型投资人:商业模式仍是最大问题
在李良看来,“从传播定位角度来看,一个产品只抓住一个点去宣传,确实更容易深入人心,让人家记住,现在大模型可以拿出来宣传主要就是长文本和多模态理解,kimi更侧重长文本,因此也更容易被外界关注到。”但随着后续互联网大厂们开始发力长文本处理,Kimi的情况,可能会因此变差。
他进一步解释道,“Kimi能够提供的长文本处理能力,通义千问、360智脑等竞争对手其实也能够提供,因此只要这些大厂一天不收费,那这类产品就收不了钱,所以它就只能一直亏钱亏下去,这是我们从投资人角度看到它商业模式最大的一个问题。”
“可能你给它一本小说,让它去概括一下,它就得花5-10元,但你却没付钱给它。”李良指出,“目前Kimi投放广告获客成本约在10元左右,如果算上拉新后用户问答互动产生的算力成本,每个用户的获客成本可能达到12-13元。”
据七麦数据下载量预估,近一个月来,Kimi 在App Store日均下载量5445,在安卓端全渠道日均下载量12360,合计日均下载量为17805。按此计算,Kimi每天在安卓+IOS端获客成本便将达21.366万-23.147万。如果再加上网页及小程序等其他渠道获客增长,Kimi每月的获客成本不在小数。
“如果Kimi一直持续这样的模式,却找不到新的创收渠道,这样的做法无异于‘烧钱赚吆喝’。”李良透露,“在月之暗面近期获得的10亿美元融资中,其中第一期交割的8亿美元融资中,阿里领投了7.9亿美元融资,其中有6亿美元是必须放在共管账号中,必须消耗阿里云相关服务的。”
“如果他们后续无法创造能够盈利的商业模式,最终的宿命,可能也就是被并购成为阿里的一部分。”李良猜测道。