很可惜 T 。T 您现在还不是作者身份,不能自主发稿哦~
如有投稿需求,请把文章发送到邮箱tougao@appcpx.com,一经录用会有专人和您联系
咨询如何成为春羽作者请联系:鸟哥笔记小羽毛(ngbjxym)
文:王智远 | ID:Z201440
早上朋友发信息给我:
智远,你可以呀,现在厉害了,不仅写作,还成了当代艺术家,还去悉尼、新加坡办画展,业务够多,忙得过来吗?
我顿时不知道怎么回应,惊讶又好奇的回了句:纳尼?
紧接着,朋友发来一张截图说:你看。我一看,天呐,AI搜索把我的资料和另一位同名人的资料,混在一起了,太坏了。认识我的还行,不认识的明显会被误导。
这两年,不少大模型公司布局AI搜索,很多人也感受到技术带来的快捷,不过,使用过程中,根本没意识到信息是否准确。
所以,怕你被AI误导。
我抽出时间,做了一个简单科普,比如:AI搜索的决策模型什么样?为啥机器味严重?AI搜索和内容平台的关系是什么?未来搜索会发生什么革命性变化等等。
毕竟了解底层知识,能够帮你,更好的用AI搜索。
有个词叫缸中之脑(Brain in a Vat)。什么意思呢?
想象一个血腥的画面:
你(或者别人)被一位疯狂的科学家,进行一次可怕的实验。他把大脑从身体上取下来,放进一个装有维持大脑存活的营养液的玻璃钢中。
然后,大脑神经末梢,链接到一台超级计算机,计算机按照设定程序,向你的大脑发送各种信息,让你以为以前很正常。
那么,对取出来的大脑来说,世界是不是依然和原来的一样?你看到的人、物体、天空,感受,还有记忆,是不是都还在?
这个实验,常用来说明怀疑论、唯我论和主观唯心主义的观点,简单讲:即我所体验的、看到的、到底是真的假的呢?
怕你共情不多,我再举个例子:
好不容易休息半天,躺在沙发上,看着外面阴雨天,突然想到昨天刚上映的恐怖片,还没看。于是,打开影片,刚看一半,心跳加速,你决定不看了。
为什么?因为太恐怖了。恐怖画面的信息,一次次传递到“缸中之脑”,让你觉得太真实,似乎恐怖画面马上要出现在自己身上。
但你知道吗?这些都是大脑模仿出来的,看似真实,未必真实,我们的感知,不仅由大脑产生,身体,也会影响它。
比如:
521到了,即便没有见面,你总送心爱的人一些温暖的东西,一杯奶茶、一束鲜花,她收到礼物那一刻,在远方也能感受到你对她的好看。
这就是具身认知,是思考,感觉、行为三者共振的结果,认识到它,你能感受到,外面我们接收到的任何信息,故事是一个个画面,所描绘的场景只要大脑熟悉,它都会共鸣。
而AI搜索,是什么呢?本质像一个“缸中之脑”。
运行在一个强大的模型上,模型像它的基础,帮它站稳脚跟,外面信息是它的食物,通过你的搜索,不断训练自己推理能力。
不论什么AI搜索软件,当你问题时,它都会遵循一个六步走的公式:
理解问题
检索信息
整合答案
生成回答
结果验证
幻想一下,现在来到未来时代,站在图书馆里,面前有一个人工智能,现在要找一本《穷查理宝典》,你会怎么做?
你可以手动输入,或者对着它说:“帮我找一本叫《穷查理宝典》。”此时,AI会利用语言技术,快速分析你的意图,提炼出最重要的部分,比如:书名、作者、人名。
然后,它会把你的问题和图书馆里的文档、图片快速匹配,从中找出重要的段落和句子。接着,它会做降噪处理,去掉干扰的内容,比如广告、重复的段落,确保剩下的都是有用的信息。
最后,AI会把所有找到的信息整合起来,生成一个答案,这就是AI搜索的过程。不难理解吧。
我突然想到一个画面:
小时候,老师经常说:“哎,你们是我带过最差的一届,要是无法理解,就把这段内容死机硬背下来。”,可你有没有想过,考试对死记硬背来说,意图是什么?
从人工智能角度看,答案只有一个词:检索。
也就是说:你背诵的所有资料,最后一刻,学校用一张试卷来检索大脑有没有记住,当成绩达标时,证明你通过了。
明白AI搜索的六步公式,能得到什么启发呢?有两点:
一,知道AI的回答为什么很干巴,二,知道它为何缺乏情感和个性。
AI搜索生成逻辑有一些限制,为避免产生错误信息和不准确的信息,AI会倾向于保守地给你高频、标准化的表达。这种倾向自然会使回答显得更加刻板。
比如:
你问AI如何做好品牌营销?它一定会告诉你,首先要了解目标市场,然后创建一个独特的品牌定位,接着进行市场推广,最后通过反馈不断优化品牌策略。
另外,作为“缸中之脑”,AI只有一个搜索框,无法感受你的语气,看不到其他信息,所以也无法理解你的情感。
这样一来,AI生成的答案就缺乏人类的情感色彩和个性,看起来很机械,或者像是官方的回答。
值得一提的是:人们常说,一个人学习什么知识,他的见识就有多高。AI也是一样的。你给它喂草料,它自然吐不出钻石来。
所以,大公司为了防止AI搜索出来的内容很水,就会限制训练内容,会给AI喂新闻报道、学术论文和正式文本。这些文本风格比较客观,所以,AI学完后,回答也会是类似的风格。
现在AI搜索虽然看似有推理能力,但我测试了很多,发现整体推理还是比较弱。
一个主要原因,人类说话时,本身推理性就不强。所以,AI学习的内容也会相对较弱。在文字相关的搜索上,这种情况很常见,理科的内容相对更严谨一些。
显然,“缸中之脑”就是“缸中之脑”。看似聪明,但离不开三点:一,大模型作为基础,二,固定的模型,三,知识库。
因此,重要的结论是:用AI搜索时,你不给它一个很健全的 prompt,它的解析能力会变得很弱,得到的答案自然很难让人满意。
你有没有想过,AI搜索平台和内容生态到底什么关系?
我觉得,从过去的传统搜索,到现在AI搜索,用一句话来形容转变的过程便是:从独立到融合,再到独立。
为什么呢?
没有大模型之前,谷歌在1998年开始做大规模搜索,后来进军中国,由于数据方面的问题,谷歌被限制,随后,百度在2000年快速崛起,靠爬虫抓取大量网页,然后分发和售卖广告起家。
这两家公司商业模式基本相似。
谷歌做了一个叫Knowledge Graph的知识库,还有Google Answers,百度则推出了“百度知道”和“百度百科”。
后来,国内360、搜狗也跟着做类似的产品。网页时代落幕,张一鸣用一个算法推荐,让今日头条拔地而起。头条采用推荐机制的同时,也尝试建立内容生态。
比如:
孵化垂类创作者,推出各种与内容相关的产品,但直到现在,我都觉得它还没成功,今日头条增长停滞后,头条搜索也没法跟着增长。
后来短视频涌现,抖音起来,它建立一个良好的内容生态和增长模式,所以,抖音搜索成功了。
不管怎么样,它们的核心目的只有一个,把内容控制在自己手里,通过掌握内容,建立壁垒,因为内容生态对搜索平台有很大的依赖性。
内容提供者,要依靠搜索引擎,来让内容被更多人看到,而搜索引擎,则要高质量的内容来吸引用户,并提供有用的搜索结果。
有了大模型之后呢?
微软推出新版必应,紧接着谷歌、百度、360和昆仑万维等企业也开始布局AI搜索。
李彦宏一直强调,把生成式AI技术和搜索深度整合在一起。周鸿祎也说,做搜索引擎的企业,最有机会研究像ChatGPT这样的产品,还有昆仑万维、秘塔AI也在加紧跟上。
不管怎么说,它们有相似之处:整合全网信息,让用户用自然语言表达需求,并提供经过组织和提炼的答案,这样可以减少冗余信息的时间消耗,确保答案的可追溯性、可信赖性。
不过,尽管这些搜索引擎,凭借原有的知名度、用户基础在市场上占据主导地位,由于移动互联网时代APP的“信息孤岛”现象,它们并没有完全掌控所有信息,反而,垂直搜索引擎正在逐渐崛起。
比如:
小红书推出自己的搜索,今日头条推出豆包,淘宝推出原生AI应用——淘宝问问,它嵌入淘宝搜索框,服务于月活跃用户近9亿、每日产生数百亿次搜索的庞大流量。
现在,抖音搜索量在移动端已经超过百度,小红书通过用户的真实分享和有用的笔记,建立了强大的社区氛围,这都是各自的优势。
因此,我看到两种趋势正在出现:一是通用搜索的AI升级,二是垂类搜索的崛起。
垂类搜索数据,主要来自自己的平台,类似于站内搜索,信息更服务于细分场景。当信息量足够多时,就会自然涌现。
长远来看,拥有优质内容的社区,做的搜索会更有优势,因为好内容平台能够吸引和留住用户,进而提升搜索功能的价值和使用频率。
明白这些也就理解了,我为什么说,搜索会经历从独立到融合,再到独立的过程。毕竟,独立,是全新的独立,是细分的独立。
实在不信的话了,你想想360AI、秘塔AI,天工AI到底有什么区别?把它们和淘宝问问、抖音搜索一比更明确呢?因此,未来优质内容社区的搜索功能将会胜出。
到这里,我们可以思考下:AI搜索的本质是什么?
我认为,AI搜索真正的关键在于AI技术本身,而不是传统的搜索方式。这就像“AI+”和“+AI”的区别。
AI+,更像把AI技术加到已有的系统或产品上。比如,在传统搜索引擎上加入AI功能,这种方式主要在现有技术基础上,增强功能。
+AI,不一样。
要求从一开始就以AI为核心,建立一个系统或产品。比如,设计一个完全依赖AI进行的搜索引擎,它所有功能都围绕AI技术展开,更像是从头开始,完全依赖AI技术运作。
很显然,“AI+”是改进现有系统,而“+AI”是从零开始,完全依靠AI技术。AI搜索真正力量在于后者,也就是“+AI”。
对于一般简单问答,AI搜索只弥补传统搜索的不足。但要真正创新和突破,要寻找新的应用场景和特定领域,比如学术、医疗、法律等。这些领域中,AI驱动的搜索才能真正发挥战略意义。
“AI原生”(AI Native)很重要,因为经过多年的发展,传统方法已经挖掘了所有可能性,AI原生的定义是,只有在引入AI能力的情况下,产品才能实现。
这种情况下,AI是最大的变量,但AI比例并不重要。
关键在于产品需要找到交叉点:哪些场景是只有AI才能实现?同时又满足大规模用户需求。这种探索越多越快,竞争优势就越大。这也是对各家产品经理的巨大考验。
那么,问题来了:
有人会觉得,传统搜索市场还有价值吗?肯定的。
传统搜索的强项在于寻址和寻找资讯。从商业角度看,PC端搜索市场增量有限,移动端又被抖音、小红书等平台分流,不过,百度财报中,搜索引擎依然是基本盘的重要组成部分。
还有人认为,谷歌和百度垄断这么多年,其他玩家还有机会吗?来看一组美国statcounter机构的数据:
截至2024年5月6日,美国搜索市场中,谷歌份额下降到了77.52%,其他市场被Bing和Yahoo蚕食,但谷歌基本盘还算稳。国内截至4月,电脑端必应的份额是37.24%,百度是22.53%,但百度的主导地位已经不在了。
虽然数据会存在偏差,但能看出搜索市场的变化和机会,AI搜索更应该理解用户意图,完成复杂的任务。
比如:
用户搜索不仅仅是寻找信息,还包括找地址,或查找短内容的源头;再比如,通过AI找到过去5年城市人口的发展趋势,甚至,搜索新能源汽车的渗透率趋势和原因。
还有找电影、追溯图片等等......,所以,需求背后,是AI搜索目前还没有攻克的场景。
总结而言
AI+,还是+AI,要看企业选择。
不论哪条路,我都认为,垂直领域的数据,将成为重要开采对象,不然怎么向数据要增量?那么问题来了:什么样的垂直数据还未被开采呢?嗯,值得思考的问题。
本文为作者独立观点,不代表鸟哥笔记立场,未经允许不得转载。
《鸟哥笔记版权及免责申明》 如对文章、图片、字体等版权有疑问,请点击 反馈举报
Powered by QINGMOB PTE. LTD. © 2010-2022 上海青墨信息科技有限公司 沪ICP备2021034055号-6
我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。
一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
1)反对宪法所确定的基本原则;
2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
5)煽动民族仇恨、民族歧视,破坏民族团结;
6)破坏国家宗教政策,宣扬邪教和封建迷信;
7)散布谣言,扰乱社会秩序,破坏社会稳定;
8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法规禁止的其他内容;
2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
1)轻蔑:贬低、轻视他人及其劳动成果;
2)诽谤:捏造、散布虚假事实,损害他人名誉;
3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
6)谩骂:以不文明的语言对他人进行负面评价;
7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
8)威胁:许诺以不良的后果来迫使他人服从自己的意志;
3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
2)单个帐号多次发布包含垃圾广告的内容;
3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。
4. 色情低俗信息,主要表现为:
1)包含自己或他人性经验的细节描述或露骨的感受描述;
2)涉及色情段子、两性笑话的低俗内容;
3)配图、头图中包含庸俗或挑逗性图片的内容;
4)带有性暗示、性挑逗等易使人产生性联想;
5)展现血腥、惊悚、残忍等致人身心不适;
6)炒作绯闻、丑闻、劣迹等;
7)宣扬低俗、庸俗、媚俗内容。
5. 不实信息,主要表现为:
1)可能存在事实性错误或者造谣等内容;
2)存在事实夸大、伪造虚假经历等误导他人的内容;
3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。
6. 传播封建迷信,主要表现为:
1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
2)求推荐算命看相大师;
3)针对具体风水等问题进行求助或咨询;
4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;
7. 文章标题党,主要表现为:
1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
2)内容与标题之间存在严重不实或者原意扭曲;
3)使用夸张标题,内容与标题严重不符的。
8.「饭圈」乱象行为,主要表现为:
1)诱导未成年人应援集资、高额消费、投票打榜
2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序
9. 其他危害行为或内容,主要表现为:
1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
2)不当评述自然灾害、重大事故等灾难的;
3)美化、粉饰侵略战争行为的;
4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。
二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。
三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)