很可惜 T 。T 您现在还不是作者身份,不能自主发稿哦~
如有投稿需求,请把文章发送到邮箱tougao@appcpx.com,一经录用会有专人和您联系
咨询如何成为春羽作者请联系:鸟哥笔记小羽毛(ngbjxym)
文:王智远 | ID:Z201440
请问:你知道Kimi Chat吗?
产品出来时,我写过一篇「测评文章」,许多读者阅读后表示用了起来。Kimi Chat不仅能搜索资料,还能处理PDF、doc、xlsx、PPT等格式文件,最大支持100MB,处理上限为20万字。
我注意到,各种讨论中,大家对Kimi有不同反应。
有人觉得不错,称其为国产之光;也有人觉得没有达到预期,处理一些较长的内容、长期坚持一个对话时,会出现幻觉。
不过,3月18日,他们在上下窗口技术上,又取得一项新突破,现在Kimi能处理长达200万字的“长文本”输入,并且开启了内测。
没错,短短5个月再次升级。
想要申请200万字上下文功能的内测非常简单,只需登录Kimi Chat官网,点击对话框下方第一条提示,加入内测队列,几个小时后,就会收到新的通知。
嗯,经过体验我学到一些新知识,也有一些不同心得。
从哪里分享呢?就从「200万字」的话题开始吧。
你可能遇到过这类情况:
当用AI工具处理一篇文章、一个网页链接、一个PDF文件时,它却跟你说,内容太长了,超出处理限值,请上传一个字数更少的文档。
咦,然后,你会疑惑的检查下文档大小,发现明明符合要求,怎么就不行了呢?别急,其实AI工具计算方式和你想的不一样。
在计算机科学和自然语言处理(NLP)领域中,它们以“token”作为计量单位,token和普通的文字字符是不同的概念。
什么是token呢?
简单讲:一个单词、一个数字、或一个标点符号。
比如:
拿句子“The quick,brown fox jumps over the lazy dog。”来说,分词后,可以得到The、quick、brown、fox等;在英文里,“I love apples”这句话分词后会变成“I”、“love”、“apples”三个tokens。
处理文本数据时,自语言技术首先会进行“分词”(tokenization),把整个文本拆分成一个个tokens,这样做的目的,是它可以更好地分析、理解文本的具体含义。
我研究了一下,ChatGPT、Gemini、Claude国外AI模型,把一个汉字算作1到3个token,他们用一种叫字节对编码(BPE)的方式来分解文字。
国内像文心一言、智谱AI更倾向于用WordPiece分词策略,做法是将单词分成更小的部分,即“子词”,以便更好地理解罕见的词和词根。
简单来说,将复杂的内容拆成简单的小块,让模型学得更好。
所以,当你看到某AI模型声称能处理10万字,实际处理不了这么多,因为一个汉字可能等于多个token,导致实际处理的字数比看上去的少。
明白这些你也就理解了,为什么有时文本看起来没达到上限,却说超过模型处理的能力了。
目前AI领域,比20万汉字上下文高的只有谷歌的Gemini 1.5 Pro(100万token),它主要针对情境学习能力,以及Claude 3定制版(100万token)。
月之暗月团队再一次将Kimi能力升级到200万字,的确是一项重大突破。那么,问题来了:停留在20万字时,你会用Kimi做什么呢?
我问了一圈,得到不少答案。一位朋友说:问想不起来的事儿。
我没太懂,让他解释一下。他说:
前天,读到一篇文章,讲一个女孩在街上被人杀害,周围有很多人看到了,但没有人出手相助。他问这是什么情况,意味着什么?
于是这个问题交给AI。
AI告诉他,心理学中,该现象被称为“旁观者效应”,即紧急情况下有多个目击者,个人采取行动的可能性会降低。AI还提供一些历史上的案例作为参考。简而言之,提供深刻的见解和背后的理论支撑。
另一个朋友说:问灭火器口诀含义。什么?口诀?
他说,前天消防安全培训,讲师提到一个口诀叫“提拔握压”。当时没懂啥意思,人多也没敢提问,于是,回家后想到用AI来解答疑惑。
他问AI,「提拔握压」口诀具体什么意思,操作灭火器要注意哪些要点,以及常犯的错误有什么?结果AI帮他解决了疑惑。
袄,我懂了。很多工具可以帮助我们解决问题,即使在人多不好意思问的情况下,回头也能找到答案。
还有一个朋友说:帮我出谋划策比较多一些。
前几天,没有经过总经理签字的情况下,把一个文件送去了应急局;但总经理明确提到他不同意按照我已经报上去的信息上报材料。现在材料送去了应急局了,总经理又提出这个事儿,怎么处理比较好?
于是,他把问题甩给了Kimi。
Kimi告诉他,一,承认错误,向总经理说明情况;二,尝试联系应急局,看看是否能暂时搁置那份文件;三,如果做不到,赶紧与总经理讨论,商定共同立场,以便在应急沟通时一致对外。
四,制定一个预防措施,以后遇到此类问题怎么改正流程;五,处理时,要保持积极乐观的态度,不要因为领导生气而抱怨。
嗯,按照此逻辑执行,领导相当满意,成功躲过一劫。
原来可以这样。还有一个朋友说,他前两天用Kimi搞定了一份安全检查表。
他的职业是安全管理,在一家化工厂工作。最近因为社会上火灾事故频发,对火灾隐患的监管变得更加严格了。所以,他要制定一个专门针对危险化学品生产企业的火灾隐患排查表。
于是,直接把需求给了AI。告诉它需要一个包含车间、检查项、检查标准、检查记录、整改措施、整改负责人和完成日期等信息的表格。结果AI直接做好给了出来。
的确,每个人用法都不同。
我平时阅读文章、整理别人文章的大纲、要么查找某个公司财报,有时也会让它帮我把一些问题条理化。
前几天接到一个小活儿,内部写的文案有点啰嗦,想把整个公司介绍PPT修改下,我就把文案甩给了Kimi,分分钟搞定。
所以,不难看出,针对AI,20万字以内的处理能力,大家做的事情相似,包括搜索、提问、结构化内容,以及做表格等操作,还有一些朋友会用它写Midjourney的提示词等。
那么,当AI具备200万字处理能力时,你会怎么看呢?
不妨从工作的角度想想该问题。
一个HR朋友说,最近BOSS直聘找工作的属实多,我每天平均回复在50家以上,要筛信息,看履历,看项目经验,真头疼。
想象一下,一份简历大概500到800字,如果用AI,按1000字算,一次性能吃进去2000个简历;让AI从2000份简历中筛选候选人,听起来是不是挺方便?
人力资源评估这类事情,已经有海外大厂在做了,AI 评估会更全面,而且不带个人感情,这不一定是最好的办法,至少给了更多选择的可能性。
我最近看商业周刊,还翻一些外文书,但之前用AI帮忙读书总被字数限制弄得头大,有时,ChatGPT也不能直接处理,我不得不把书一分为二给AI。
就拿国外很火,但国内还没上的《AI产品经理》一书来说,之前让Kimi来帮我读,因为字数太多直接被卡壳了;不过,昨天解锁200万字能力后,再次一次性给它,不仅迅速搞定,还帮我把全英文内容翻译成了中文,效率的确高不少。
还有一点,200万字的AI学习能力的确很强。
拿编程来说:一般人想成为软件开发专家,得下不少功夫,学好几种语言,弄清楚算法和数据结构,才能对开发流程了如指掌。
但是,有能力处理200万字的AI,情况完全不同,它能迅速吸收、分析海量编程资料、教程和代码,很快掌握各种编程知识和技巧,还能针对具体问题提出更好的解决方案,这种学习和应用速度,对我们人类来说是难以想象的。
我试着把将要出版的第三本书的素材交给它,让它帮我重新理一下思路,没想到表现出乎意料,迅速分析并给出结构。
可能有些人用过之后就没再继续深究,但我觉得,这种能处理大量文字的技术,对于这些互联网上班的人来说,工作方式又面临一次变革。
为什么?AI 对我们的影响,有三种级别:
一,影响很低,可以不当回事;二,威胁到一部分脑力工作者的职位;三,彻底改变,甚至让很多工作消失,
如果到达第三阶段,你会怎么办?
有人会拿蒸汽机初期的故事来比喻,记得当时纺织工人因为害怕失业而砸毁机器。但是,随着技术广泛应用,他们最终还是面临着被淘汰的局面。
在我看来,之前机器主要取代体力劳动,让人们转向脑力工作。AI出现情况就不一样了,它正在把我们从脑力工作中挤出去。
那问题来了,AI是不是要我们回到体力劳动呢?
我觉得并非如此。
AI学得快,处理信息也厉害,但有些事情还搞不定。比如:AI能查法律条文、分析案子,但它不能在法律上帮你辩护。
在美国,律师们已经说了,如果AI想上法庭那就违法了,这些限制并非AI做不到,而是,人类给AI设定了一些规矩。
为什么要设定规矩呢?因为责任问题、传统惯例、或出于伦理考虑。至少一段时间内,AI进入不了这些领域,但只是暂时的。就拿律师助理来说,如果AI做的比人好,那助理迟早被淘汰。
这就像大规模生产导致的产能过剩。所以,我们接下来要竞争的,是那些看不见摸不着的东西。
什么是看不见的呢?
第一点:隐性知识(Tacit Knowledge)。AI只能作为纸上谈兵的咨询师,它可以告诉你香蕉多好吃,它却没吃过香蕉,乔布斯在1992年演讲时,这样形容过某些咨询公司。
所以可以肯定,AI当中也存在看不见的知识。你只有不断总结个人经验,才能获得一些竞争性优势,至于这种优势有没有价值,就另当别论了。
时不时,我就碰上一些网友反复问的那些老问题。
比如:现在自媒体还能不能做?还有没有前途?其实,这问题和写作的根本道理挺像,大家都在写东西,有的人甚至用AI帮忙写。
每个人的内容,都有自己的风格,有的文章像纸上谈兵,一看就不再看了;但有些内容一看就知道作者亲身实践出来,这种东西AI模仿不来;所以,虽然AI也有它自己的知识体系,但对我们来说,也有看不见的东西。
因此,隐性知识(Tacit Knowledge)是竞争力之一。
第二点:学会提出好问题和保持怀疑的能力。
提问有啥难的?确实,用5W2H、黄金圈法则这样的技巧提问,看起来能得到你想要的答案。AI也能进行因果分析。
但你知道吗?AI获取信息的方式不是直接体验,它提供给你的答案是根据数据模拟出来的,建立在统计学之上。
比方说,你打算在某个地方开家咖啡馆,让AI帮你分析那里的人流、消费水平、竞争对手数量,还有营销策略。AI给出了答案,你真的敢信吗?
它没有亲自去过,只是通过数据推算出来的。所以,反提问、质疑能力未来会成为一个人的基本功。
第三点:你可能要占领一定高地。
什么是高地?与别人拉开距离遥不可及的东西。影响力算,作品也算,优势也算。
要建立优势,得思考怎么做出与众不同的事,找到独特位置。这个过程需要时间,也要不断的尝试和实践。
当你和别人做同样的事时,再怎么努力也只是在维护系统中权力者地位,而自己想要获得更多掌控力的可能性,却在减小。
我观察到,有些朋友纠结于原地,是因为他们从未考虑过在哪些方面构建起「可以持续积累的优势」。
真正好的机会往往不会有太多人和你争,因为大多数人没办法坚持超过五年,这类机会,在短期内看起来平平无奇,不怎么样,不能立刻给你积极的反馈。
而且,超过5年以上的机会,参与者安全感是匮乏的,他们在没有信心时,总愿意问别人怎么看来获取信心,其实,时间上能跨越五年以上的机会是靠心力积累出来的。
因此,如果你还没找到自己的优势所在,不妨思考下,如何构建起「结构性优势」和「可以持续积累」的能力。
隐性知识(Tacit Knowledge)、学会提出好问题和保持怀疑的能力,以及结构性不断累积的影响力,我想,是AI不可替代的稀缺能力。
总结而言:
阳光明媚时修屋顶。
想办法把经历的事情,工作的思考沉淀下来,去挖掘它们和人生的关系,让AI帮你优化,你得到的数字资产,会比别人更具壁垒性。
对于线上从业者,未来要靠影响力和专业实力吃饭了。
本文为作者独立观点,不代表鸟哥笔记立场,未经允许不得转载。
《鸟哥笔记版权及免责申明》 如对文章、图片、字体等版权有疑问,请点击 反馈举报
Powered by QINGMOB PTE. LTD. © 2010-2022 上海青墨信息科技有限公司 沪ICP备2021034055号-6
我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。
一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
1)反对宪法所确定的基本原则;
2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
5)煽动民族仇恨、民族歧视,破坏民族团结;
6)破坏国家宗教政策,宣扬邪教和封建迷信;
7)散布谣言,扰乱社会秩序,破坏社会稳定;
8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法规禁止的其他内容;
2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
1)轻蔑:贬低、轻视他人及其劳动成果;
2)诽谤:捏造、散布虚假事实,损害他人名誉;
3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
6)谩骂:以不文明的语言对他人进行负面评价;
7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
8)威胁:许诺以不良的后果来迫使他人服从自己的意志;
3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
2)单个帐号多次发布包含垃圾广告的内容;
3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。
4. 色情低俗信息,主要表现为:
1)包含自己或他人性经验的细节描述或露骨的感受描述;
2)涉及色情段子、两性笑话的低俗内容;
3)配图、头图中包含庸俗或挑逗性图片的内容;
4)带有性暗示、性挑逗等易使人产生性联想;
5)展现血腥、惊悚、残忍等致人身心不适;
6)炒作绯闻、丑闻、劣迹等;
7)宣扬低俗、庸俗、媚俗内容。
5. 不实信息,主要表现为:
1)可能存在事实性错误或者造谣等内容;
2)存在事实夸大、伪造虚假经历等误导他人的内容;
3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。
6. 传播封建迷信,主要表现为:
1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
2)求推荐算命看相大师;
3)针对具体风水等问题进行求助或咨询;
4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;
7. 文章标题党,主要表现为:
1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
2)内容与标题之间存在严重不实或者原意扭曲;
3)使用夸张标题,内容与标题严重不符的。
8.「饭圈」乱象行为,主要表现为:
1)诱导未成年人应援集资、高额消费、投票打榜
2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序
9. 其他危害行为或内容,主要表现为:
1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
2)不当评述自然灾害、重大事故等灾难的;
3)美化、粉饰侵略战争行为的;
4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。
二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。
三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)