APP推广合作
联系“鸟哥笔记小乔”
真假“长文本”,国产大模型混战
2024-03-26 13:45:23

来源 | 光锥智能

文|郝 鑫

Kimi有多火爆?凭一己之力搅乱A股和大模型圈。

Kimi概念股连日引爆资本市场,多个概念股随之涨停。在一片看好的态势中,谁都想来沾个边,据光锥智能不完全统计,目前,至少有包括读客文化、掌阅科技、万兴科技等在内的十家上市公司发布公告透露正在了解或接入了Kimi 智能助手。

眼看着Kimi的火越烧越旺,大厂也垂涎三尺,连夜加入了大模型“长文本” 的四国大战。

对标月之暗面Kimi 智能助手的200万字参数量,百度文心一言将在下个月开放200万~500万字长文本处理功能,较此前最高2.8万字的文档处理能力提升上百倍;阿里通义千问宣布升级,开放最高1000万字的长文本处理能力;360智脑正在内测500万字,功能正式升级后将入驻360AI浏览器。

四家中国大模型公司把长文本能力“卷”出了新高度。作为参考,目前,大模型最强王者OpenAI的GPT-4 Turbo-128k可处理文本能力约为10万汉字,专攻长本文的Claude3-200K上下文处理能力约为16万汉字。

但同样都是“长”,有人是孙悟空,有人是六耳猕猴。

一位大模型行业的人士向光锥智能表示:“确实有一些公司用RAG(检索增强)来混淆视听。无损的长文本和RAG,两项技术各有优势,也有结合点,但归根到底还是不同的技术……很容易就用‘长本文’来混淆视听。”

“百度、阿里、360,大概率都使用了RAG方案”,该业内人士表示道。

无论是RAG还是长文本,一味地“长”并不能代表所有。如同上一轮,大模型厂商“卷”参数,大模型参数不是越大就越好,文本长度,也不是越长,模型效果就越好。除了上下文长度,记忆能力、推理能力、算力都是共同的决定性因素。

进入2024国产大模型落地元年,大模型应用千千万,为什么是长文本能率先掀起波澜?基于长文本的特性,又能解决哪些AI应用落地的实际问题呢?

长文本,真的越长越好吗?

自ChatGPT诞生以来,国外一直在持续不断地涌现出新的AI应用,产生流量的同时,也令人看到了商业化的可能性。

据风险投资公司a16z近期发布的《GenAI 消费应用 Top100 报告》显示,用户月访问量最大的应用网站中,类ChatGPT的效率助手占据了榜单前十的大壁江山,ChatGPT的每月网络访问量接近20亿次,第二名Gemini的每月访问量约为4亿次。

真假“长文本”,国产大模型混战

但同样AI应用活跃而繁荣的场景却并没有在中国成功上演。在月之暗面的Kimi 智能助手凭借流量和人气出圈之前,国内能够达到一定体量的应用只有两个,一个是百度推出的文心一言App,另一个是字节跳动推出的豆包。

据相关数据统计,截至2023年9月,百度文心一言App的月活量达到最高峰值710万;同年12月,字节豆包月活达到200万,2024年1月在此基础上翻了一番达到400万。

文心一言凭借百度的大模型先发优势和搜索流量优势,一度成为国内流量最大的AI应用;而豆包背靠抖音流量转化池,虽然发布时间稍晚一步,但在后期实现了反超。

在这样背景之下,Kimi的爆火显得尤为特殊,某种意义上可以说,Kimi是国内第一个靠产品能力和用户自来水破圈的AI应用。

月之暗面创始人杨植麟曾告诉光锥智能,其团队发现正是由于大模型输入长度受限,才造成了许多大模型应用落地的困境,这也是月之暗面聚焦长文本技术的原因所在。

站在用户角度来看,好不好用是检验AI应用产品最关键的指标,而这都依赖于Kimi背后的长文本技术。

若将长文本的能力进一步拆解,大致可以包括长度、记忆、理解、推理几个能力。

越来越长的文本长度,可以进一步提升现在AI应用的可用性和专业性。

对普通用户而言,与AI助手简短的闲聊能够引起兴趣,但不能解决问题,特别对于法律、医学、金融等一些专业领域,需要前期“喂”给大模型特定的数据和知识,才能精准地输出答案;对企业而言,更需要一个“专家型”的助手,大量的企业数据、行业数据都需要提前导入,没有损耗地输入和输出,从而保证最后的分析结果具有可参考性。Claude就是一个典型的例子,凭借长文本的优势与ChatGPT走出不同的路线,收获了大量的2B垂直行业的企业用户。

多轮对话和记忆能力可以直接应用到现在大部分的场景中,比如游戏场景中的NPC,通过长文本输入给予其角色设定,玩家每一次的对话都会被记录,并且能够生成个性化的游戏档案,避免了重新登录而需要反复唤醒的问题;在执行Agent(智能体)任务场景,能够增强记忆能力,辅助Agent形成清晰的行动步骤,避免出现Agent打架的现象。

长文本的理解和推理能力体现在两个方面,一类是对想象类的应用理解生成,一类是对逻辑类应用的生成。例如在对AI小说的应用中,长文本的能力体现在能够理解用户输入的prompt,对其想象性的扩写;在编程、医疗问答等领域,则需要调用其逻辑的推理能力,合理化地续写编程,根据用户描述推理病状。

月之暗面副总裁许欣然曾表示,大模型无损上下文长度的数量级提升,将进一步打开对 AI 应用场景的想象力,包括完整代码库的分析理解、自主完成多步骤复杂任务的智能体Agent、不会遗忘关键信息的终身助理、真正统一架构的多模态模型等。

所以,长文本从来都是一项综合性的能力,而非越长就越好。相反,过分追求长,可能引发算力匮乏的问题。

大模型公司卷“投流”,一天获客成本20万

流量狂飙、宕机后五次扩容;日活用户数达百万,月环比增长率107.6%;赶超微信、杀进App Store免费版应用第五名,月之暗面交出了一份漂亮的成绩单。

但这也只是一个开始,多位业内人士在今年刚开年曾向光锥智能透露,走过高速技术迭代的2023年,大模型来到了产业落地和商业化的下半场。

去年,各家已经相继亮剑,智谱、百川、面壁不同程度上都开启了商业化。月之暗面稍慢,目前还未公布商业化的方案,但急切地开始了商业化加速进程,B站、抖音等社交平台都能看到Kimi助手投流的广告。

 

真假“长文本”,国产大模型混战

尽管,各家都从未将2C的变现路线排除在外,但是延续2016年AI 1.0时代的思路,多数还是将2B作为了首要的突破口。有了技术,去找技术和产业落地方向,探索落地方案似乎成为了理所应当。

月之暗面则是大模型公司的另类,去年10月份第一次公开露面后,就瞄准了2C的应用市场。杨植麟曾表示,长文本是月之暗面根技术,在这技术之上可以分裂出不同场景和领域的2C应用。

在Kimi效应爆发前,就有很多普通和企业用户反馈,“Kimi是国内最好的AI助手,没有之一”,从一开始就注重产品效果和用户体验的Kimi,现在爆发似乎带有一定的必然性。

商业化压力之下,大模型公司大概率会选择2B、2C两条腿走路。对比其他大模型公司,月之暗面则又提供了另一种商业化的路径参考,其他玩家从先2B再2C,以2B拉动2C,而月之暗面则属于先2C后2B,再以2C的产品拉动2B的单子。

毕竟,除了国外的ChatGPT,之前在国内根本看不到2C产品增长的案例。Kimi靠近半年的积累,凭一己之力在2C撕开了一道口子,众多大厂或许是看到了2C更多的可能性,才急于下场向市场证明自身具备长文本能力。

但回到商业化赚钱的本质,仍要思考如何将一时的流量转化成实打实的付费率。

光锥智能观察发现,现在大部分的大模型公司在推产品时还是互联网推流的那一套,旧瓶装新酒,抖音、B站、小红书投流推广,在线下的写字楼电梯、机场、地铁打广告。

真假“长文本”,国产大模型混战

一通操作下来的实际转化率有多少尚未可知,但为获客花出去的都是真金白银。据新浪科技报道,有投资人透露,目前Kimi用户获客成本达到12元~13元。根据下载量预估,Kimi近一个月来日均下载量为17805。按此计算,Kimi每天的获客成本至少20万元。

现在市面上大部分的AI助手都是免费下载使用,基于网络负外部效应,当用户越来越多的时候,其资源的耗损就越来越大。此次的Kimi宕机事件就是最好的例证,顺时暴涨的用户量给算力和服务器都造成了压力,与之带来的还有大量的token成本的消耗。

对大模型公司而言,规模化、付费率和成本的三方拉扯问题,短时间内无法得到解决,即使是流量吊打其他应用的ChatGPT也面临盈亏平衡的困境。

据data.ai数据显示,截至2023年6月19日,ChatGPT iOS端上线首月的日活付费率约为4.36%。OpenAI预测,对于压缩成本后的GPT-3.5模型和GPT-4模型,若月付费率每月提升0.25%或不能持续;若月付费率每月提升0.5%或能扭亏。

月付费率不断提升听起来很性感,但现实却是“未老先衰”,爆发性的增长还未迎来,增长停滞先一步到来。

对大模型厂商,特别是创业公司来说试错的机会并不多,不能刚从技术的坑出来,又一头扎进投流的坑,跟风长文本不能解决所有问题,跑出商业化模式才是。

光锥智能
分享到朋友圈
收藏
收藏
评分

综合评分:

我的评分
Xinstall 15天会员特权
Xinstall是专业的数据分析服务商,帮企业追踪渠道安装来源、裂变拉新统计、广告流量指导等,广泛应用于广告效果统计、APP地推与CPS/CPA归属统计等方面。
20羽毛
立即兑换
一书一课30天会员体验卡
领30天VIP会员,110+门职场大课,250+本精读好书免费学!助你提升职场力!
20羽毛
立即兑换
顺丰同城急送全国通用20元优惠券
顺丰同城急送是顺丰推出的平均1小时送全城的即时快送服务,专业安全,准时送达!
30羽毛
立即兑换
光锥智能
光锥智能
发表文章126
前沿科技,数字经济。公众号:光锥智能(guangzhui-tech)
确认要消耗 羽毛购买
真假“长文本”,国产大模型混战吗?
考虑一下
很遗憾,羽毛不足
我知道了

我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。


一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
    1)反对宪法所确定的基本原则;
    2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
    3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
    4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
    5)煽动民族仇恨、民族歧视,破坏民族团结;
    6)破坏国家宗教政策,宣扬邪教和封建迷信;
    7)散布谣言,扰乱社会秩序,破坏社会稳定;
    8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
    9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
    10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
    11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
    12)危害未成年人身心健康的;
    13)含有法律、行政法规禁止的其他内容;


2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
    1)轻蔑:贬低、轻视他人及其劳动成果;
    2)诽谤:捏造、散布虚假事实,损害他人名誉;
    3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
    4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
    5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
    6)谩骂:以不文明的语言对他人进行负面评价;
    7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
    8)威胁:许诺以不良的后果来迫使他人服从自己的意志;


3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
    1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
    2)单个帐号多次发布包含垃圾广告的内容;
    3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
    4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
    5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
    6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
    7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
    8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。


4. 色情低俗信息,主要表现为:
    1)包含自己或他人性经验的细节描述或露骨的感受描述;
    2)涉及色情段子、两性笑话的低俗内容;
    3)配图、头图中包含庸俗或挑逗性图片的内容;
    4)带有性暗示、性挑逗等易使人产生性联想;
    5)展现血腥、惊悚、残忍等致人身心不适;
    6)炒作绯闻、丑闻、劣迹等;
    7)宣扬低俗、庸俗、媚俗内容。


5. 不实信息,主要表现为:
    1)可能存在事实性错误或者造谣等内容;
    2)存在事实夸大、伪造虚假经历等误导他人的内容;
    3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。


6. 传播封建迷信,主要表现为:
    1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
    2)求推荐算命看相大师;
    3)针对具体风水等问题进行求助或咨询;
    4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;


7. 文章标题党,主要表现为:
    1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
    2)内容与标题之间存在严重不实或者原意扭曲;
    3)使用夸张标题,内容与标题严重不符的。


8.「饭圈」乱象行为,主要表现为:
    1)诱导未成年人应援集资、高额消费、投票打榜
    2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
    3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
    4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
    5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序


9. 其他危害行为或内容,主要表现为:
    1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
    2)不当评述自然灾害、重大事故等灾难的;
    3)美化、粉饰侵略战争行为的;
    4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。


二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。


三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)

我知道了
恭喜你~答对了
+5羽毛
下一次认真读哦
成功推荐给其他人
+ 10羽毛
评论成功且进入审核!审核通过后,您将获得10羽毛的奖励。分享本文章给好友阅读最高再得15羽毛~
(羽毛可至 "羽毛精选" 兑换礼品)
好友微信扫一扫
复制链接