很可惜 T 。T 您现在还不是作者身份,不能自主发稿哦~
如有投稿需求,请把文章发送到邮箱tougao@appcpx.com,一经录用会有专人和您联系
咨询如何成为春羽作者请联系:鸟哥笔记小羽毛(ngbjxym)
@松果财经原创
作者| 琴声奏响时
“创新的速度比创新本身更重要。”埃隆·马斯克曾这样说到。
近日,由马斯克所掌舵的特斯拉,在2024年世界人工智能大会上正式推出了第二代Optimus(擎天柱)人形机器人,距离第一代面世,仅过去9个月。
加速升级的人形机器人不负所望,成了今年WAIC大会(世界人工智能大会)的一大看点。除此以外,今年的WAIC大会还引发了哪些热门话题?带来了哪些前瞻指引?
今年,华为盘古、百度文心、阿里通义、腾讯混元等国内知名大模型悉数都参加了WAIC,大模型依旧是重头戏之一。
大会开幕期间,在谈及大模型闭源与开源的选择时,两大头部企业陷入明显分歧。百度创始人、董事长兼首席执行官李彦宏称,模型开源无法做到众人拾柴火焰高,商业化闭源模型才最能打。
阿里云CTO周靖人则重申了阿里云开源开放的选择,并强调阿里两年前决定将通义大模型开源开放,时至今日,通义千问已经实现真正意义上的全尺寸、全模态开源,拉平了开源、闭源模型之间的差距。
相较而言,开源大模型和闭源大模型孰好孰坏,其实并没有定论。
从技术层面来看,闭源由于不公开源代码,安全性和服务质量更高,而且可以通过销售许可或提供基于模型的服务来盈利;但同时许可费高昂,外界难以审查监管,而且升级迭代高度依赖内部团队,速度有限。
开源则恰好相反,技术门槛和成本较低,吸引了全国范围的开发者和研究者参与,创新和迭代速度更快,适配更多应用领域,但无门槛的技术共享也带来了权益被侵犯的风险,质量、稳定性和安全性难以保证。
对比来看,闭源想要走向“成功”,唯一的路径就是进化为“超级应用”,从而创造价值;而开源凭借独有的兼容性打造了强有力的获客手段。由此可见,看似截然不同的两个方向背后,是由各自的商业利益驱使。
从应用层面来看,开源和闭源并不像手机端的iOS系统或者安卓系统只能二选一,尤其在ToB的情况下,应用端既需要技术共享也会考虑应用安全性,还需要满足多样化需求。
对此,百川智能CEO王小川表示,预计未来将有80%的企业会用到开源大模型,因为闭源没办法对产品做更好的适配,或者成本特别高,闭源可以给剩下的20%提供服务。
由此可见,二者并不是非此即彼的对立关系,在不同产品和应用场景中也可以是互补的关系。但归根究底,大模型在发展之余如何创造价值,选择开源还是闭源就不是核心问题,因为仅有基础模型却没有应用,就等同于一文不值。
大模型作为人工智能大家族的组成部分,一直是热议的话题之一。随着WAIC 2024的落幕,AI应用落地的最新趋势也昭然若揭。
继百模大战后,大模型的“精耕细作”一直在持续。以ChatGPT和Sora为代表的大模型技术,也已进入新一轮迭代。从今年的WAIC来看,百度、阿里巴巴、腾讯、华为等行业巨头带来众多新技术和新产品,展现了大模型在金融、医疗、政务等多个行业场景的应用潜力。
截至目前,百度有千帆大模型平台、文心一言,阿里有阿里云百炼、通义大模型,腾讯有腾讯云混元大模型、元宝大模型,字节跳动有火山方舟、豆包大模型等等。
在过去的2023年里,大模型的长文处理能力、数字能力、推理能力、RAG(检索增强生成)、GPTs、多模态、原生应用、开源等多方面都有大幅增强。同时,训练和部署成本、行业适配能力、幻想问题以及数据安全这四大挑战也得以优化和解决。
图源来自数巅科技
在此基础上,定制化的大模型给To B和To C业务带来了非常深刻和彻底的改造,企业用户和终端个人用户也逐渐呈现刚性需求。基于此,To C产品可以通过不断收集用户反馈、积累模型的应用实践,来反哺ToB业务,从而加速大模型商业化落地。
今年,人形机器人专区也是大会的一大亮点。在世博展览馆的中厅,18台人形机器人组成阵列展示“才艺”,并与观众亲切互动,可见机器人技术的协同效应以及在"异构群智"领域的重大突破。
随着人形机器人和AI两大领域的高速发展,产业进入深度融合阶段,AI大模型+人形机器人正掀起下一波技术热潮。
从技术角度看,两者在自然语言交互、知识库与推理、多模态感知与决策、运动规划、任务规划与执行、情感交互、持续学习等七个板块均有结合应用的可能性。
在实际应用方面也已经取得突破。比如WAIC 2024大会上,特斯拉的Optimus二代机器人将深度学习应用于视觉感知,实现了精准的目标识别与抓取,而且可以直立行走,进行路线规划。
自然语言交互领域,Xiaomi CyberOne等人形机器人搭载大语言模型,实现了高自然度语音交互。情感交互领域,Hanson Robotics的Sophia机器人通过面部表情合成和声音合成,实现了丰富的情感表达。
通过以上技术的融合,我们有望创造出具备感知、决策、规划、控制、交互、学习等多维能力的人形机器人,最终赋予其真正的智能化、人性化。
除了大模型、人形机器人,AI的终端产品逐渐渗透至日常生活。正如三次工业革命,蒸汽时代诞生蒸汽机、电气时代发明电灯泡、信息化时代创造计算机,每一件革命性的“新物种”都被应用于终端场景,AI大航海时代的产物也将如此。
杨元庆展示AI PC新产品
今年,多个行业涌现了"终端新物种"。比如戴尔、联想、华为的AI PC新产品、内置大模型语音助手的雷鸟AR眼镜X2 Lite、实现AI翻译的时空壶同声传译器X1,以及今年上半年被热议最多的苹果vision pro混合现实头显,等等。
追本溯源,终端产品的涌现,主要得益于AI模型、AI应用、AI硬件的协同发展。从AI产业结构来看,产业链上游为基础层,包括算力等,中游为算法和模型层,下游为应用层。先有算力、芯片等“硬件”的完善和加持,再是大模型、算法的“精耕细作”,终端“新物种”应运而生。
随着AI生态和技术的不断进化,未来AI终端还将迎来架构设计、交互方式、内容、应用生态等的全面创新和升级。或许,我们会从提问“AI终端应该长什么样”,转为好奇“AI终端会长什么样”。
2024年,伴随大数据处理、高性能计算、深度学习等技术的快速发展和成熟,人工智能已经能够解决大量的复杂问题,加上日益成熟的大模型技术,人工智能的准确度、效率、通用性、灵活性得到显著提升。
应用层面,随着现代社会产生的数据开始爆发式增长,为人工智能的进化提供了“养料”,人工智能得以更好地学习和理解现实世界。加之,个人用户和企业客户对于个性化、高效的服务需求日益增强。
在底层技术高速发展,以及市场需求的牵引下,人工智能(AI)已经由“+AI”模式转型至“AI+”模式的阶段。
对比来看,早前的“+AI”阶段,人工智能还只是一项补充技术,被运用于传统行业的既有业务流程和产品之中,目标在于提升效率、解决特定问题。
如今的“AI+”阶段,AI不再仅仅是业务流程的附属部分,更是各行各业创新发展的重要驱动力,其核心在于数据驱动和自我学习,利用神经网络模型进行大量数据的训练,模拟人脑的学习机制,从而实现语音识别、图像识别等多领域超越人类的表现。
这一阶段跨越的完成,意味着AI从单纯的技术附加工具转向了引领行业变革的关键要素,从赋能单一功能升级为重塑整个业务形态。
业务形态的重塑具体到应用场景,覆盖了交通出行、生活服务、工业制造、文化传播、医疗健康、农村建设等多个领域。
AI+交通领域,在AI算法的加持下,车辆能够处理海量的传感器数据,实现对车辆周围环境的高精度感知。同时,还能预测其他车辆的行驶轨迹,为自动驾驶车辆提供决策依据。最重要的是,AI算法通过不断学习和优化,可以提升自动驾驶系统的性能和安全性。
AI+制造领域,由于大模型、机器学习、计算机视觉等细分技术实现突破,人工智能可以被应用于制造业全流程各环节,通过挖掘各单一环节的数据信息,进而赋能整体的预测、生产、管理、决策,从而实现精细化管理,助力企业降本增效。
工信部数据显示,经过智能化改造,制造业研发周期缩短约20.7%、生产效率提升约34.8%、不良品率降低约27.4%、碳排放减少约21.2%。
长远来看,“AI+”的潜力已经开始展现。
2024年,AI应用落地的想象力无效迸发。大模型加速商业化、AI 和人形机器人深度结合、终端新物种大量涌现,大航海时代的历史齿轮开始高速运转。
不只是人工智能行业,整个产业链也在加速扩容,AI+交通、AI+汽车、AI+文化、AI+制造等都开始从理论走向实践,走进生产和生活。
“AI+”时代真的来了。
本文为作者独立观点,不代表鸟哥笔记立场,未经允许不得转载。
《鸟哥笔记版权及免责申明》 如对文章、图片、字体等版权有疑问,请点击 反馈举报
Powered by QINGMOB PTE. LTD. © 2010-2022 上海青墨信息科技有限公司 沪ICP备2021034055号-6
我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。
一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
1)反对宪法所确定的基本原则;
2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
5)煽动民族仇恨、民族歧视,破坏民族团结;
6)破坏国家宗教政策,宣扬邪教和封建迷信;
7)散布谣言,扰乱社会秩序,破坏社会稳定;
8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法规禁止的其他内容;
2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
1)轻蔑:贬低、轻视他人及其劳动成果;
2)诽谤:捏造、散布虚假事实,损害他人名誉;
3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
6)谩骂:以不文明的语言对他人进行负面评价;
7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
8)威胁:许诺以不良的后果来迫使他人服从自己的意志;
3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
2)单个帐号多次发布包含垃圾广告的内容;
3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。
4. 色情低俗信息,主要表现为:
1)包含自己或他人性经验的细节描述或露骨的感受描述;
2)涉及色情段子、两性笑话的低俗内容;
3)配图、头图中包含庸俗或挑逗性图片的内容;
4)带有性暗示、性挑逗等易使人产生性联想;
5)展现血腥、惊悚、残忍等致人身心不适;
6)炒作绯闻、丑闻、劣迹等;
7)宣扬低俗、庸俗、媚俗内容。
5. 不实信息,主要表现为:
1)可能存在事实性错误或者造谣等内容;
2)存在事实夸大、伪造虚假经历等误导他人的内容;
3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。
6. 传播封建迷信,主要表现为:
1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
2)求推荐算命看相大师;
3)针对具体风水等问题进行求助或咨询;
4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;
7. 文章标题党,主要表现为:
1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
2)内容与标题之间存在严重不实或者原意扭曲;
3)使用夸张标题,内容与标题严重不符的。
8.「饭圈」乱象行为,主要表现为:
1)诱导未成年人应援集资、高额消费、投票打榜
2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序
9. 其他危害行为或内容,主要表现为:
1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
2)不当评述自然灾害、重大事故等灾难的;
3)美化、粉饰侵略战争行为的;
4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。
二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。
三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)