很可惜 T 。T 您现在还不是作者身份,不能自主发稿哦~
如有投稿需求,请把文章发送到邮箱tougao@appcpx.com,一经录用会有专人和您联系
咨询如何成为春羽作者请联系:鸟哥笔记小羽毛(ngbjxym)
来源 | 伯虎财经(bohuFN)
作者 | 森系
我们推出“回首2024”系列稿件,试图记录、分析和总结过去一年不同行业最具代表性的公司和趋势。本篇是该系列的第一篇稿件,行业是AI,主人公是字节跳动。
在当下的大模型赛道中,日均使用量达5000亿tokens ,是一个非常显著的数量级,因为它代表着这个大模型的使用量进入赛道相对领先的位置。
在自然语言处理领域,一个tokens通常是指文本中的最小单位,它可以是一个单词、一个标点符号或者一个子词单元。
换句话说,5000亿tokens/天的使用量,意味着这个大模型每天都需要处理极其大量的数据,这至少相当于处理数百万篇长文章或数千万到数亿条社交媒体帖子的日均量。
近期,中国大模型创业公司MiniMax宣称已达到单日超3万亿tokens的处理量,此消息一出,瞬间在行业内引发了强烈震荡。然而,随着大模型竞赛逐渐进入下半场,tokens处理量已不再是衡量大模型价值的唯一标准,行业内对于 “第一” 的竞争焦点已然转向了应用落地
素有 “卷王” 之称的字节跳动,尽管入局大模型还不足两年,但如今已在行业内初露锋芒。
在今年11月的AI大模型月活跃排行榜上,豆包App以5998万MAU的成绩仅次于OpenAI的ChatGPT,稳居全球第二,在国内排名第一。而它的海外版Cici的MAU也有1267万,排在第22位。
而在2024年2月,豆包的月活跃用户量才只有173万。
这显示了豆包大模型正成为国内头部大模型中,受到广泛欢迎且商业化前景可期的一个重量级选手。受此积极影响,在二级市场上,豆包大模型概念股备受投资者的热烈追捧,短短一个月内便在AI赛道中脱颖而出,成为领涨板。
从最初的上半场低调蓄力,到如今下半场的火力全开,直至当下,字节跳动所构建的庞大的大模型帝国依旧在持续扩张。那么,作为大模型战场的 “后来者”,字节跳动究竟是如何实现这一逆袭的呢?
2023年8月18日,字节跳动旗下AI对话产品Grace,更名为「豆包」。
在百模大战一波又一波密集的“重磅发布”中,这条当时看着毫不起眼的消息,悄然开启了字节大模型的新篇章。
从时间线看,相较于其他大厂,字节跳动在大模型领域的反应确实稍显迟缓。字节跳动 CEO 梁汝波在 2024 年年度全员会上也反思公司的技术敏感度不及创业公司,称公司直至 2023 年才开始深入探讨 GPT,而业内优秀的大模型创业公司多在 2018 年至 2021 年便已创立。
2019年,百度依托其 “人工智能研究中心” 的技术沉淀,率先于国内推出文心大模型,成为我国大模型领域的关键里程碑。此后,阿里巴巴的 “达摩院” 与腾讯的 “腾讯研究院” 成立,加速了自研大模型的进程。2021 年,阿里发布全球首个 10 万亿参数的多模态大模型;同期,腾讯也连续推出多个千亿至万亿参数级别的大模型,为后续研发夯实了基础。
时间来到2023年,国产大模型呈爆发之势,众多大厂及创新企业纷纷推出自研产品,如阿里通义千问1.0、腾讯混元、360 智脑、华为盘古、科大讯飞星火、商汤日日新、百川大模型以及智谱AI的GLM等。
当行业发展渐行至深水区,字节才姗姗来迟。
实际上,字节跳动并非轻视 AI 技术。早在2012年,字节就自研了第一版推荐引擎,并在2016年成立了AI Lab。但随着AI Lab核心人员的相继离职,字节在AI领域的探索逐渐放缓。直到ChatGPT的横空出世,字节才意识到在大语言模型领域的发展相对滞后,并促使字节跳动CEO梁汝波在2024年初的全员会上进行深刻反思。
为了赶上这场AI技术革命,字节跳动迅速调整战略布局,采取一系列措施,包括大规模招募AI人才、成立专门的AI部门Flow、整合内部资源、实施赛马机制等,以加速豆包大模型的研发进程。
今年3月,豆包的下载量和月活跃用户开始双双登顶。11月份,这种势头仍在延续。ChatGPT仍以超3亿月活遥遥领先(APP+web用户),但豆包的崛起速度远超其竞争对手。国内的Kimi、文小言、通义千问在用户规模上均被豆包甩在身后,豆包甚至超过后面三者月活用户的总和。
从C端的豆包APP用户,到B端的千行百业,豆包大模型不仅使用量大,应用场景之丰富也可见一斑。根据火山引擎总裁谭待介绍,目前,豆包大模型日均处理文本1200亿tokens,生成3000万张图片。
只用了一年多就取得了令所有AI应用创业者眼馋的成绩,虽然大模型起步晚了点,但字节还是完成了从“迟到者”到“破局者”的快速锐变。
众所周知,从ChatGPT惊艳登场开始,AI领域的想象力被再度点燃,大模型迅速占据核心地位,新一轮的AI浪潮已汹涌澎湃两年之久。在这期间,围绕技术与产品的迭代速度,以及商业化落地的效率,一场 “百模大战” 如火如荼地展开,成为各方势力无法回避的关键战场。
国内互联网科技公司纷纷入局,包括百度、阿里、腾讯、华为等大厂,科大讯飞、商汤科技、旷视科技等垂直于AI领域的厂商,以及智谱华章、百川智能、达观数据等大模型初创企业,还有金融、汽车、教育、智能家居、消费电子等垂直行业企业也基于垂直领域人工智能技术和数据积累等能力,自主研发大模型。
此外,市场上也活跃着高校和研究机构的身影,约四分之一的大模型由这些学术机构发布。可见,从大厂到创业公司,从科技企业到高校研究机构,各方纷纷入局,使得市场竞争极为激烈。
从当下的视角审视,历经激烈的百模混战之后,基础大模型领域经历了一场严酷的筛选,近乎 “十不存一”。但作为大模型战场的“后来者”,字节又是如何实现逆袭的?
归根到底,C端卷用户,B端卷价格,与竞争对手卷算力。“饱和式”攻击的豆包,在哪个领域都上演了“后来者居上”的戏码。
据统计,今年以来,豆包在C端投流上的费用已经超过了10亿元。这种高强度的市场投放,让豆包在社交媒体、搜索引擎和短视频平台上迅速占领用户的视觉入口,形成了强烈的品牌记忆点。
如果说C端市场的投放是圈用户心智的“火力战”,那么在B端市场,豆包则打响了一场极具杀伤力的“价格战”。
在今年5月火山引擎FORCE原动力大会上,豆包Pro 32k模型正式定价是1千Tokens 0.8厘,比行业的价格降低99.3%;豆包Pro 128k模型正式定价为是1千Tokens5厘钱,较行业价格降低了95.8%。
更形象的说法是,根据火山引擎公布的价格计算,一元钱就能买到豆包主力模型的125万Tokens,大约是200万个汉字,相当于三本《三国演义》。
没有像其他公司公布大模型时的各种测评和榜单,字节走的是实用主义的路线,希望用一个打破行业地板的价格得到用户,尤其是企业用户的认可。
此外,大模型之争是算力之争、人才之争。在这一背景下还得益于字节稳定且持久的资源注入。
在资金上,字节跳动在AI上投入巨大,仅是2024年资本开支达到800亿元,接近百度、阿里、腾讯三家的总和(约1000亿元)。据了解,2025年,字节跳动资本开支将进一步达到1600亿元,旨在打造自主可控的大规模数据中心集群,其中约900亿元将用于AI算力的采购,700 亿元用于IDC基建以及网络设备。
在AI人才储备上,公司创始人张一鸣亲自挂帅,从阿里巴巴集团以及零一万物、智谱等竞争对手公司大力招揽 AI 人才,并在内部多次强调追求 “通用人工智能” 的目标。
正因如此,字节才能在这场 AI 应用的激烈混战中突出重围,凭借豆包大模型的稳定性、可靠性以及强大的应用开发能力,逐渐构筑起自身独有的竞争优势,在 AI 领域崭露头角,占据一席之地。
“面向AI时代,所有产品都值得用大模型重新升级。”这是曾经时任阿里CEO的张勇看法。如今这一论断已得到充分印证。国内众多互联网平台纷纷将AI技术深度融入自身核心业务,并在传统赛道上加速推出全新的AI产品。
字节也不例外。豆包大模型,只是字节大模型应用的一个侧面。随着大模型的逐渐成熟,抖音、火山引擎、巨量引擎等业务部门也都开始加入 AI 探索。
截止目前,字节正已经推出了豆包大模型家族、火山方舟以及一系列前沿的AI应用与云基础设施产品。
基于豆包大模型,豆包大模型家族已扩展至9大产品线,涵盖通用、角色扮演、语音合成、声音复刻、文生图、语音识别、向量化及Function call等多种模型,全方位满足用户与企业的多样化需求。
火山方舟应用场景聚焦于B端包括智能外呼、数字人、数据助理等等,可以降低企业使用大模型的成本和技术门槛,目前已经与汽车、手机、金融、食品饮料等领域的龙头企业展开了密切合作,包括吉利汽车、长城汽车、OPPO、vivo、小米、华硕、招商银行、海底捞等。
而在豆包大模型基座赋能下,还进一步诞生了AI 智能体开发平台扣子(中国版)和 Coze(海外版)、图片生成产品星绘、类 Character.AI 的角色对话产品猫箱(原叫话炉)和小黄蕉、AI教育产品豆包爱学(原河马爱学)、出海搜题产品 Gauthmath 等数款 AI 软件和互联网应用。
从大模型产品、基础AI开发、到AI社交,再到AIGC创作,字节已构建起一个全面的AI产品生态体系。
移动互联网时代,字节就有「App工厂」之称,所以相继打造今日头条和抖音两个爆款产品,借此成为最赚钱的中国互联网公司之一。
大模型时代,不可否认字节还要再造一个新的增长奇迹——名为「AI工厂」,从中寻找第三个超级应用的可能性。
当然,AI软件之外,字节同样不愿放弃将大模型与硬件做结合。毕竟在万物互联的趋势下,硬件是软件落地的载体,也是用户流量通向生态的通道,而AI硬件的发展路径,也不过是软件侧的平移。
今年5月的火山引擎FORCE原动力大会,字节对外展示了3款外部合作方开发的AI硬件产品,包括机器狗、学习机,以及学习机器人。
在中秋期间,字节又推出了AI陪伴玩偶显眼包,作为火山引擎的特别礼品,分发给客户。
与普通玩偶不同的是,显眼包搭载了FoloToy的大模型AI机芯Magicbox(魔匣),可以呈现豆包大模型和扣子的能力。用户只需通过简单的指令便可以与显眼包进行互动,这个玩偶式AI也会回应你。
尽管字节不想承认显眼包是一款正式的产品,但将AI装进玩具里的这一次试水,无疑是一次新的头脑风暴。
值得注意的是,在硬件方面的探索,对于字节来说已是驾轻就熟。
从2018年收购锤子科技坚果手机团队和部分专利使用权,并发布了坚果手机、TNT显示器以及音箱等周边产品,到2020年聚焦教育硬件赛道,启动“大力教育”品牌,发布了智能学习灯、教育平板、词典笔等多款产品,以及2021年收购国内VR出货量第一的厂商PICO。
只是强敌环伺硬件市场、“双减”政策的影响,字并没能做出多少效果,目前大力教育官网也仅剩智能学习灯一款产品的身影。PICO去年多次裁员,如今仅保留少部分硬件团队。
现阶段,AI计算正在加速渗入各行各业,一场看不见的革命也许就在不久的未来。但同时从上面不难看出,字节在AI时代的野心尽显无疑——从豆包大模型到AI应用流水线的打造,从软件跨越到硬件,字节希望在AI这颗新芽里,找对增长框架,快速枝繁叶茂。
文章封面首图及配图,版权归版权所有人所有。若版权者认为其作品不宜供大家浏览或不应无偿使用,请及时联系我们,本平台将立即更正。
本文为作者独立观点,不代表鸟哥笔记立场,未经允许不得转载。
《鸟哥笔记版权及免责申明》 如对文章、图片、字体等版权有疑问,请点击 反馈举报
Powered by QINGMOB PTE. LTD. © 2010-2022 上海青墨信息科技有限公司 沪ICP备2021034055号-6
我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。
一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
1)反对宪法所确定的基本原则;
2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
5)煽动民族仇恨、民族歧视,破坏民族团结;
6)破坏国家宗教政策,宣扬邪教和封建迷信;
7)散布谣言,扰乱社会秩序,破坏社会稳定;
8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法规禁止的其他内容;
2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
1)轻蔑:贬低、轻视他人及其劳动成果;
2)诽谤:捏造、散布虚假事实,损害他人名誉;
3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
6)谩骂:以不文明的语言对他人进行负面评价;
7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
8)威胁:许诺以不良的后果来迫使他人服从自己的意志;
3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
2)单个帐号多次发布包含垃圾广告的内容;
3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。
4. 色情低俗信息,主要表现为:
1)包含自己或他人性经验的细节描述或露骨的感受描述;
2)涉及色情段子、两性笑话的低俗内容;
3)配图、头图中包含庸俗或挑逗性图片的内容;
4)带有性暗示、性挑逗等易使人产生性联想;
5)展现血腥、惊悚、残忍等致人身心不适;
6)炒作绯闻、丑闻、劣迹等;
7)宣扬低俗、庸俗、媚俗内容。
5. 不实信息,主要表现为:
1)可能存在事实性错误或者造谣等内容;
2)存在事实夸大、伪造虚假经历等误导他人的内容;
3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。
6. 传播封建迷信,主要表现为:
1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
2)求推荐算命看相大师;
3)针对具体风水等问题进行求助或咨询;
4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;
7. 文章标题党,主要表现为:
1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
2)内容与标题之间存在严重不实或者原意扭曲;
3)使用夸张标题,内容与标题严重不符的。
8.「饭圈」乱象行为,主要表现为:
1)诱导未成年人应援集资、高额消费、投票打榜
2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序
9. 其他危害行为或内容,主要表现为:
1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
2)不当评述自然灾害、重大事故等灾难的;
3)美化、粉饰侵略战争行为的;
4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。
二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。
三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)