15、A100或H100:
精品AIGC学习书籍手册
相信近期大家每天都被号称“AI技术革命浪潮”的信息轰炸,国外每天AI产品/工具层出不穷,国内热点文章铺天盖地,一时间“大模型”“AGI”“AIGC”“预训练”“A100”等词汇频频出现在眼前,仿佛茶水间/午休时聊天不说几个新鲜词汇都让你感觉脱离互联网圈子了。
今天小编就从头开始给大家整理一下AI圈你需要了解的知识词汇,让即使小白的你也能轻松理解圈里人到底在讲什么。
本文主要从以下三个方面进行介绍,共计15个知识点:
AI应用领域主要分2个大方向,NLP(Natural Language Processing自然语言处理)和CV(Computer Vision,即通常所说的图像领域)。自然语言处理是号称AI 皇冠上的明珠。让计算机能够理解、分析、处理和生成自然语言。NLP技术主要涉及语音识别、文本处理、语言理解、机器翻译、问答系统、情感分析等方面。
Artificial general intelligence,即通用人工智能,是指能够像人类一样进行各种不同的任务,而不仅是单一的任务。
小白理解:我们可以将AGI比喻成一个超级智能的机器人,它可以像人类一样看、听、说、思考和学习。就像一个小学生在学习知识时需要不断地思考和探索,AGI也需要通过不断地学习和实践来不断提高自己的能力。
AI Generated Content,即利用人工智能技术来生成内容,AIGC也被认为是继UGC、PGC之后的新型内容生产方式。小白理解:可以理解为一位可以24小时工作的超级全能创作达人,可以通过计算机来生产各种文字、图片甚至视频内容。它成本更低、生产效率更高。
思维链是指一个人在思考问题时,从一个点出发,通过逐步衍生出的思路,最终得出结论的过程。
小白理解:当我们听到“小狗在跑”的时候,我们的思维链会自动启动。我们首先会理解“小狗”是一个动物,“跑”是一个动作,然后我们会逐步想到它的品种、颜色、大小等信息。最终,我们可以形成一个完整的理解,明白这个句子是在描述一只小狗正在奔跑。
模型简单来说,类似于我们小时候学习的方程式:y=f(x),即有一个输入信息x,会得到输出结果y。小白理解:比如在翻译任务中,输入就是a语种的一段文字,输出就是b语种的一段文字;在ner任务中,输入就是一个句子,输出就是每个实体的信息;在内容生成领域,输入是一个命令,输出是根据命令生成的答案等。
就是计算机通过学习已有的数据,从中总结出规律,并根据这些规律来预测或分类新的数据。常见的传统机器学习模型包括决策树、支持向量机、逻辑回归等。这些模型都是基于数学算法构建的,可以用于各种预测、分类和聚类问题。小白理解:我们可以把机器学习模型比作小学生在学习数学运算,老师给他很多例题,他学习这些例题的规律,然后再用这些规律来做新的数学题。假设我们想让计算机通过学习已有的猫和狗的图片来识别新的猫狗图片。那么我们可以把已有的猫和狗的图片作为训练集,让计算机通过学习这些图片的特征(例如耳朵、眼睛、鼻子等)来总结出识别猫和狗的规律。之后,当计算机看到一张新的图片时,它就能够根据之前学习到的规律来预测这张图片是猫还是狗。
就像是一个大脑,它可以通过大量的数据来学习和理解信息,然后做出预测和决策。小白理解:我们可以把深度学习比作高中生学习数学函数,他们通过大量的练习来找到数学函数的规律,然后可以用这个规律来解决更加复杂的数学问题。
Large Language Model,即大语言模型,LLM是一种能够生成自然语言文本的人工智能模型,它的主要作用是自动生成高质量的文章、对话和翻译等自然语言内容。小白理解:你可以把 LLM 大语言模型想象成一个非常聪明的机器人,它可以和你进行交流并且给你有用的答案。就像你问老师问题一样,LLM 大语言模型也可以回答你的各类语言文字类问题。
Generative Pre-Training,即生成式预训练模型,由OpenAi团队发表的论文而来。GPT模型从GPT1.0到GPT2.0、GPT3.0、GPT3.5发展到GPT4.0(2023年3月最新版本)。小白理解:可以把GPT相关的模型理解为一位聪明的老师,它有各个领域的知识,它可以听你说话,然后回答你的问题或者跟你聊天。
是语言模型的基础,相当于老师教给学生的教材。早期语料库特指专家语料库,由人标注的准确数据,质量高量级小,当前泛指所有人类在网络上留下的语言集合。
是大语言模型GPT3.5的一个应用类产品,可以方便所有人与之进行交互,从而利用模型进行各类语言文字类的处理任务。
百度提供的一种大语言模型的应用类产品,类似chatGPT。
意思是“提示”,在大型语言模型的上下文中,Prompt是产生文本或其他输出的起点。它可以是一个简单的句子或单词,也可以是一段较长的文本或一组特定的说明。Prompt的作用是要求模型完成一个句子、生成一个标题或回答一个问题。小白理解:假设我们使用chatgpt或文心一言,我们想要让它生成一篇新闻报道。我们可以使用以下prompt:"请根据以下信息生成一篇新闻报道:主题:2022年冬奥会;事件:中国代表团首次获得滑雪项目金牌;时间:2022年2月15日;地点:北京”。这个prompt中包含了主题、事件、时间和地点等必要信息,模型可以根据这些信息生成一篇非常切题的新闻报道。
Graphic Processing Unit,即图形处理器,又称显示核心、视觉处理器、显示芯片。小白理解:GPU可以帮助电脑进行复杂的图形计算,比如让电脑显示好看的游戏画面、动画片或者电影特效。你可以把GPU比作一个画家,它可以很快地画出很多漂亮的图画。而CPU则像是一名工人,它可以进行很多不同的工作,但是画画的速度比较慢。
A100和H100是两款NVIDIA公司生产的顶级双精度浮点数矢量运算芯片,即大家说的“AI芯片”“GPU”的一种,目前顶尖大厂训练大语言模型都是使用的这两种显卡。A100于2020年发布,使用7纳米工艺,支持AI推理和训练;H100是2022年3月发布,可谓是核弹级性能显卡,4纳米工艺,各项基础性能是A100的三倍之多,FP8的性能指标更是A100的六倍之多。结语:当然,应该还有很多知识需要储备,不过理解了上面的知识对于小白用户来说已经足够,也欢迎大家评论区提供更多你知道的知识点与大家分享交流,一起学习成长。
上文给大家详细介绍了AICG的宏观层面,模型层面,应用领域等方面。接下来我想分享一套零基础教程带大家从步入AIGC到成为AI大神,资源包我都整理好了,放在了下方。CSDN大礼包:《全套AIGC入门基础学习资源包》免费分享AIGC所有方向的学习路线思维导图
这里为大家提供了总的路线图。它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。如果下面这个学习路线能帮助大家将AI利用到自身工作上去,那么我的使命也就完成了:AIGC工具库是一个利用人工智能技术来生成应用程序的代码和内容的工具集合,通过使用AIGC工具库,能更加快速,准确的辅助我们学习AIGC
书籍阅读永不过时,阅读AIGC经典书籍可以帮助读者提高技术水平,开拓视野,掌握核心技术,提高解决问题的能力,同时也可以借鉴他人的经验,结合自身案例融会贯通。我们在学习的时候,往往书籍源码难以理解,阅读困难,这时候视频教程教程是就很适合了,生动形象加上案例实战,科学有趣才能更方便的学习下去。