很可惜 T 。T 您现在还不是作者身份,不能自主发稿哦~
如有投稿需求,请把文章发送到邮箱tougao@appcpx.com,一经录用会有专人和您联系
咨询如何成为春羽作者请联系:鸟哥笔记小羽毛(ngbjxym)
来源:黄河懂运营
Transformer、GPT、InstructGPT、大模型、AIGC......你是不是被这个概念闹晕了?
作为一个文科生+AIGC从业者+市场人,其实要搞懂ChatGPT等等晦涩的概念多多少少有些吃力,我想应该会有不少人也有这种感觉。
或者有很多非从业者想要了解ChatGPT到底会如何影响我们,或者有很多当爹当妈的被孩子问到却不知道怎么“幼儿园化”地把这些概念讲清楚。
但是我看了大部分市场上传播的文章,依然晦涩难懂,造成了不少认知门槛。
今天,我试着挑战,用一篇文章搞清楚ChatGPT的相关概念,一方面让自己加深理解,另一方面,希望对各位有用。
我的理解是,这是一种高级的“翻译机器”,它能够理解和翻译不同语言之间的文本。为了帮助你更通俗地理解这个模型,我们可以将其比作一个有着超凡记忆力和注意力分配能力的多语言翻译家。
这个翻译家有以下几种能力:
自注意力机制:这个翻译家在阅读一段文本时,不仅关注当前的单词,还能够记住并考虑到整个句子或段落中的其他单词。这种能力使得翻译家能够捕捉到文本中的重要信息和上下文关系,从而更准确地理解和翻译。
位置编码:就像翻译家在阅读时会注意到单词在句子中的位置一样,位置编码帮助模型理解单词的顺序。这对于理解句子结构和意义非常重要,就像我们知道“狗追赶猫”和“猫追赶狗”这两个句子的意思完全不同。
编码器和解码器:模型的编码器部分就像翻译家在理解原文时的大脑,它会分析输入文本的内容和结构。而解码器部分则像是翻译家在创造译文时的大脑,它会基于对原文的理解生成新的句子,相当于设计了一个程序语言。
多头注意力:这就像是翻译家有多个分身,每个分身专注于文本的不同方面,比如语法、词汇选择、文化背景等。通过这种方式,翻译家可以从多个角度理解文本,从而做出更准确的翻译。
前馈神经网络:可以比作翻译家在处理信息时的逻辑和分析能力,它会对编码器和解码器的输出进行进一步的分析和加工,确保翻译的准确性和流畅性。
GPT,一个多层的Transformer解码器,它就像是一个通过大量阅读和学习,掌握了许多语言知识和写作技巧的“虚拟作家”。这个作家不仅阅读了大量的书籍和文章,而且还学会了如何根据上下文生成连贯、有意义的文本。
想象这个作家在成长的过程中,没有老师直接告诉他哪些句子是正确的,哪些是错误的。相反,他通过阅读大量的文本,自己学会了语言的规则和模式。这就是GPT模型的自监督学习,它通过阅读大量未标记的文本数据,自己学习语言的结构和用法。
这个作家首先通过广泛的阅读来积累知识(预训练),然后在需要写特定类型的文章时,他会针对这种类型进行专门的练习(微调)。GPT模型也是如此,它首先在大量数据上进行预训练,然后在特定任务上进行微调,以提高在该任务上的表现。
在写作时,这个作家只能根据他已经写好的内容来预测下一个字或句子,而不能提前知道后面的内容。GPT模型使用因果掩码来确保在生成文本时,每个单词只依赖于它之前的单词,保证了文本的连贯性。
随着时间的推移,这个作家不断学习和积累经验,写作技巧也越来越熟练。GPT-1、GPT-2和GPT-3就像这个作家的不同成长阶段,每一代都比前一代阅读了更多的书籍,掌握了更多的知识,写作能力也更强。
到了GPT-3这个阶段,这个作家已经非常熟练,即使没有或只有很少的示例,他也能够写出高质量的文章。这意味着GPT-3能够在没有或只有极少的特定任务训练数据的情况下,理解和完成新的任务。
什么是InstructGPT?
如果 GPT-3想象成一个聪明的学生,那么 InstructGPT则是这个学生经过特别辅导后的样子。
GPT-3这个学生虽然学习了很多知识,但有时候回答问题可能会离题、编造故事、或者带有一些不公平的看法。同时,他在进行长对话时,有时会忘记之前说过的内容,导致对话不够连贯。
为了让这个学生更好地理解老师(人类用户)的意图,并且按照老师的喜好来回答问题,我们需要一种方法来调整他的学习方式,这就是“Alignment”(对齐)的概念。
为了让GPT-3变得更好,我们给他请了一个特别的家教(RLHF),这个家教通过收集老师的反馈来知道哪些答案是好的,哪些是不好的。然后,家教用这些反馈来指导学生学习,帮助他在未来给出更符合老师期望的答案。
我的理解是, ChatGPT就像是一个全能的、知识渊博的机器人图书管理员,随时准备帮助你解答问题和提供信息。而且,随着时间的推移,它会学到更多的东西,变得更加聪明和有用。
这个机器人图书管理员不仅知道很多关于书籍和文字的知识,它还能理解图片。所以,如果你给它看一张图片,它不仅能告诉你图片里有什么,还能根据图片给你讲一个故事或者回答你关于图片的问题。
如何理解这一概念?
我们用一个小学生也能理解的方式来解释这些概念。
想象一下,有一个非常非常大的学校,这个学校有很多层楼和很多教室。这个学校就像是一个“大模型”,它有很多老师(参数)和学生(数据)。这些老师非常聪明,他们可以教很多不同的课程,比如数学、语文、科学等等。
模型架构设计:这个学校的建筑(模型架构)设计得很特别,有很多教室和走廊,这样老师们就可以在不同的教室里教不同的课程,而且学生们也可以轻松地从一个教室走到另一个教室。
数据准备:为了让老师们教得更好,学校收集了很多教科书和练习册(数据),这样老师们就可以用这些资料来准备课程,并且帮助学生们学习。
计算资源:因为这个学校非常大,所以需要很多电脑和服务器(计算资源)来帮助老师们准备课程和批改作业。
优化算法:学校还有一个非常聪明的校长(优化算法),他会确保老师们用最好的方法来教学,并且帮助学生们取得好成绩。
正则化技术:有时候,老师们可能会对某个课程太专注,忽略了其他课程。校长会确保这种情况不会发生,让所有的课程都得到平衡(这就是正则化技术)。
模型并行和数据并行:因为这个学校有很多学生,所以老师们会分成小组来教课(模型并行),同时,学生们也会分成小组来学习(数据并行)。
现在,这个学校有很多成功的毕业生,比如GPT-3、BERT和T5等。他们都是在这个大学校里学习过的,现在他们可以帮助人们解决很多问题,比如写作文、做数学题或者解答科学问题。
所以,这个大学校(大模型)就像是一个能够培养出很多聪明学生的好地方,虽然它需要很多资源和努力来运营,但是它能够帮助我们做很多事情,让我们的生活变得更好。
想象一下,你有一个非常聪明的机器人朋友,它可以做很多事情,比如画画、写故事、甚至帮你做数学题。这个机器人朋友就是人工智能(AI)的一个例子。
AIGC(人工智能生成内容):这个机器人朋友可以创造很多东西,就像一个会画画和写故事的艺术家。它可以画出你想象中的图画,或者写出一个关于你最喜欢的超级英雄的故事。这就是人工智能生成内容,意味着机器人可以用它的大脑(AI技术)来创造新的东西。
Diffusion(扩散模型):想象你把一滴墨水滴进清水里,墨水会慢慢散开,最后水变得浑浊。机器人朋友就像能够把这个浑浊的水变回清澈一样,它可以从一团混乱的噪点中创造出清晰的图画。
CLIP(图文表征模型):如果你给这个机器人朋友看很多图片和它们的名字(比如“苹果”、“小狗”、“汽车”),它会学会识别这些图片。下次你给它看一个新的图片,它就能告诉你图片里是什么。
Stable Diffusion(稳定扩散模型):这个机器人朋友还可以根据你给它的提示来画画。比如你告诉它“画一个快乐的小狗”,它就能画出一个小狗的图画,而且这个小狗看起来很开心。
想象一下,如果这个机器人朋友不仅会画画和写故事,还能像人类一样理解世界,学习任何东西,并且可以做任何工作,那么它就像一个真正的小朋友一样了。这就是通用人工智能,它能够做任何人类能做的事情。
现在的AI,比如GPT,就像是一个在某个特定领域(比如写故事)非常擅长的机器人,但它并不像真正的小朋友那样理解世界。科学家们正在努力让AI变得更像人类,但这是一个很大的挑战,需要很多时间和研究。
所以,AIGC就是让AI像艺术家一样创造内容,而AGI是让AI变得像人类一样理解和做事。
大型语言模型就像是一个非常非常聪明的图书管理员,它读过很多书,知道很多关于语言的知识,可以帮助我们做很多事情,甚至可以自己写故事。
想象一下,这个图书馆管理员每天都在阅读图书馆里的成千上万的书籍。它通过阅读这些书籍,学会了很多单词、句子和故事。这就是大型语言模型的训练过程,它通过阅读大量的文本数据来学习语言。
因为读过很多书,这个管理员可以帮你做很多事情。比如,它可以给你讲一个故事的摘要,或者帮你把一个故事翻译成另一种语言,甚至可以告诉你一个故事里的人物是开心还是伤心。大型语言模型也是这样,它可以执行很多不同的任务,比如文本总结、翻译和情感分析。
这个管理员之所以这么聪明,是因为它有一个超级大脑,里面有很多“小房间”(参数),每个“小房间”都存储着不同的信息和知识。大型语言模型也是这样,它有很多参数,这些参数帮助它记住和理解语言的复杂规则和模式。
当你问这个管理员一个问题,或者给它一个主题时,它可以给你一个答案或者讲一个故事。它可以根据它读过的书籍和学到的知识,创造出连贯和有意义的文本。大型语言模型也是这样,它可以生成新的文本,就像它自己在写故事一样。
GPT-3、ChatGPT、BERT和T5就像是不同领域的图书馆管理员,有的可能更擅长讲故事,有的可能更擅长解释科学知识,而文心一言就像是会写诗的图书管理员。它们都有自己的特长,但都能帮助我们理解和使用语言。
微调就像是在你已经学会一项技能的基础上,做一些小的改变和练习,让你能够更好地完成一个特定的任务。这样做可以节省时间,因为你不需要重新学习所有的东西,只需要专注于你需要改进的部分。
举个例子,你在学习骑自行车。你的爸爸或妈妈先带你在一个空旷的大公园里练习(这就像是预训练模型,公园里的各种地形就像是大量的数据,帮助你学会骑车的基本技巧)。
现在你已经会骑车了,但是你想学习如何在你家附近的小山丘上骑(这就像是一个新的任务,需要微调)。因为小山丘的路和公园里的路可能不一样,有上坡、下坡和弯道,所以你需要一些特别的练习来适应这些新的情况。
你的爸爸或妈妈会带你在小山丘上练习几天,这样你就会知道如何在上坡时蹬得更用力,在下坡时控制速度,在弯道时转弯(这就是微调过程,你在学习如何应用你已经掌握的骑车技巧来适应新的环境)。
微调的好处是,因为你已经知道怎么骑车了,所以你不需要再从零开始学习,只需要做一些小的调整就可以了。这就像是微调一个已经预训练好的模型,让它适应一个新的任务,比如理解医学文本。
自监督学习就像是通过读故事和玩游戏来学习新单词,而不需要别人告诉我们答案。这样,我们可以用很多没有标签的数据来训练模型,让模型变得更聪明。
比如你正在读一本非常有趣的故事书。你读了很多页,学到了故事里的很多新单词和句子。现在,如果你的朋友在旁边,你可以玩一个游戏:你给他读故事的一部分,然后遮住一些单词,让你的朋友猜下一个单词是什么。这个游戏就像是自监督学习。
在这个游戏中,你的朋友不需要别人告诉他正确的答案是什么,因为故事的上下文(已经读过的部分)就是线索。你的朋友可以通过他已经知道的单词和故事的内容来猜测下一个单词。这就是自监督学习的方式,模型通过已经知道的信息来学习新的东西,而不需要额外的答案或标签。
本文为作者独立观点,不代表鸟哥笔记立场,未经允许不得转载。
《鸟哥笔记版权及免责申明》 如对文章、图片、字体等版权有疑问,请点击 反馈举报
Powered by QINGMOB PTE. LTD. © 2010-2022 上海青墨信息科技有限公司 沪ICP备2021034055号-6
我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。
一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
1)反对宪法所确定的基本原则;
2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
5)煽动民族仇恨、民族歧视,破坏民族团结;
6)破坏国家宗教政策,宣扬邪教和封建迷信;
7)散布谣言,扰乱社会秩序,破坏社会稳定;
8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法规禁止的其他内容;
2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
1)轻蔑:贬低、轻视他人及其劳动成果;
2)诽谤:捏造、散布虚假事实,损害他人名誉;
3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
6)谩骂:以不文明的语言对他人进行负面评价;
7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
8)威胁:许诺以不良的后果来迫使他人服从自己的意志;
3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
2)单个帐号多次发布包含垃圾广告的内容;
3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。
4. 色情低俗信息,主要表现为:
1)包含自己或他人性经验的细节描述或露骨的感受描述;
2)涉及色情段子、两性笑话的低俗内容;
3)配图、头图中包含庸俗或挑逗性图片的内容;
4)带有性暗示、性挑逗等易使人产生性联想;
5)展现血腥、惊悚、残忍等致人身心不适;
6)炒作绯闻、丑闻、劣迹等;
7)宣扬低俗、庸俗、媚俗内容。
5. 不实信息,主要表现为:
1)可能存在事实性错误或者造谣等内容;
2)存在事实夸大、伪造虚假经历等误导他人的内容;
3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。
6. 传播封建迷信,主要表现为:
1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
2)求推荐算命看相大师;
3)针对具体风水等问题进行求助或咨询;
4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;
7. 文章标题党,主要表现为:
1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
2)内容与标题之间存在严重不实或者原意扭曲;
3)使用夸张标题,内容与标题严重不符的。
8.「饭圈」乱象行为,主要表现为:
1)诱导未成年人应援集资、高额消费、投票打榜
2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序
9. 其他危害行为或内容,主要表现为:
1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
2)不当评述自然灾害、重大事故等灾难的;
3)美化、粉饰侵略战争行为的;
4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。
二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。
三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)