职贝云数AI新零售门户

标题: AI大模型的基础知识点汇总 [打印本页]

作者: 8PSoKs86y 时间: 昨天 20:02
标题: AI大模型的基础知识点汇总
文章目录

近几年AI范畴的技术发展一日千里，毫无疑问AI曾经成为了先进消费力的代表。作为一名普通程序员假如对相关技术不闻不问，等待本人的只能是淘汰。这里以一个小白的视角，梳理了近些年AI前沿的一些技术和那些大家容易忽视的基本概念，也算是给本人一个入门吧。 AI的基本特性

普通程序和AI(Artificial Intelligence)程序的本质区别在于处理信息和执行义务的方式不同:
普通程序通常是程序员指定程序运转的规则和指令。这些程序遵照预定义的逻辑和算法，对特定的输入做出相应的输入。输入-处理逻辑-输入都是透明的符合确定性，是静态的。
AI程序运用学习算法和统计模型，以阅历学习来替代明白编码的规则，经过从大量数据中学习和自我调整来执行义务。人工智能系统的决策基于概率和统计推断，而不只仅是基于预先定义的规则，输入-处理逻辑-输入是个黑盒，具有不确定性和模糊性，是动态的。
普通程序的规则是静态的，程序行为都是固定的。人工智能程序是动态的，可以经过学和顺应来提高其功能，处理愈加复杂具有不确定性和模糊性的成绩。
机器学习和深度学习技术都触及到运用数据模型，这些模型会从大量数据中学习形式和规律，并在未知数据上做出预测或执行特定义务。
强化学习是一种技术，它结合了模型和奖励机制，使代理可以在与环境的交互中学习最佳行为策略。
AI模型训练的关键步骤:数据搜集、数据预处理、模型选择、模型训练、模型评价。
次要技术

输入技术
自然言语处理(NLP)和自然言语了解(NLU): 自然言语处理技术使得计算机可以了解、解释和生成人类言语。这包括机器翻译、情感分析、语音辨认等运用。
计算机视觉: 计算机视觉范畴触及让计算机了解和解释视觉信息。这包括图像辨认、物体检测、人脸辨认。
学习范式
机器学习: 经过对数据停止学习，使计算机系统可以从阅历中改善功能的方法。它涵盖了多种学习方法，包括监督学习、无监督学习、强化学习等。
监督学习: 是一种机器学习范式，其中模型经过运用带有标签的训练数据停止训练，学习输入和输入之间的映射关系。模型的目的是学会从输入到输入的映射，以便对新的、未标记的数据停止预测。
无监督学习: 是一种机器学习范式，其目的是从未标记的数据中发现形式、结构或规律。与监督学习不同，无监督学习没有预先提供标签或目的输入，系统必须自行探求数据并找到隐藏的结构。
半监督学习: 半监督学习是介于监督学习和无监督学习之间的一种学习方式。它应用同时具有标签和未标签数据的训练集停止学习。虽然数据中只要一小部分是带有标签的，但模型试图应用这些标签信息以及未标签数据的特征来停止学习。
强化学习: 是一种学习方式，触及智能体经过与环境的交互学习，以最大化累积的奖励信号。智能体在不断尝试和错误中学习，并根据奖励信号调整其策略，以在特定环境中获得最大长期报答。
迁移学习: 迁移学习是一种应用已学到的知识来处理新成绩的方法。它触及将从一个成绩(源域)中学到的知识或模型迁移到另一个相关但不同的成绩(目的域)中，以提高目的义务的功能。
深度学习: 深度学习是一种机器学习的子范畴，它运用深度神经网络来模拟和学习复杂的数据表示。深度学习方法经过多层次的神经网络学习数据的层次性特征表示，以提高对义务的功能。
基本运用

感知才能
学习人类的感知才能是AI目前次要的焦点之一
“听”：语音辨认、音色辨认、声纹辨认、声响传导心情辨认
“说”：语音生成、文本转换语音(tts)、音色转换
“读”：自然言语处理(NLP)、自然言语了解(NLU)
“写”：机器翻译、文本生成
“看”：机器视觉、图像辨认、人脸辨认、物件侦测、指纹辨认。
认知才能
指的是人类经过学习、判别、分析等等心思活动来了解音讯、获取知识的过程与才能，对人类认知的模拟与学习也是目前AI第二个焦点范畴。
学习才能：例如机器学习、深度学习、强化学习等各种学习方式。
分析辨认才能：例如医学图像分析、产品引荐、渣滓邮件辨认、法律案件分析、犯罪侦测、信誉风险分析、消费行为分析等。
判别才能：例如AI下围棋、自动驾驶车、健保诈欺判别、癌症判别等。
预测才能：例如AI执行的预防性维修(Predictive Maintenance)、智能自然灾祸预测与防治。
创造力
指的是人类产生新思想，新发现，新方法，新实际，新设计，创造新事物的才能，它是结合知识、智力、才能、个性及潜看法等各种要素优化而成，这个范畴目后人类仍遥遥抢先AI，但AI也试焦急起直追。
次要范畴包括：AI作曲、AI作诗、AI小说、AI绘画、AI设计等。
核心机构和厂商

国外

OpenAI
OpenAI(开放人工智能研讨中心)是一个美国人工智能研讨实验室，OpenAI的研讨重点是强化学习。
OpenAI的次要产品如下:
ChatGPT(聊天生成预训练转换器): 是OpenAI开发的人工智能聊天机器人程序，于2022年11月推出。该程序运用基于GPT-3.5、GPT-4架构的大型言语模型并以强化学习训练。ChatGPT目前仍以文字方式交互，而除了可以用人类自然对话方式来交互，还可以用于甚为复杂的言语工作，包括自动生成文本、自动问答、自动摘要等多种义务。
DALL-E: 是一个人工智能系统，可以根据自然言语的描画创建逼真的图像和艺术作品。
OpenAI Codex: 是由 OpenAI 训练的 AI 模型，用于协助代码生成。它可用于自动执行编码义务、提供代码建议，甚至生成残缺的代码片段。
Whisper: 可以将语音转录为文本，并将多种言语翻译成英语。
OpenAI Gym：是一个用于开发和比较强化学习算法的工具包。它提供了广泛的预构建环境和工具，用于训练和测试强化学习代理。
nvidia
NVIDIA创立于1993年1月，是一家以设计和销售图形处理器为主的无厂半导体公司。其消费的高功能GPU加速了AI技术的发展。
A100-80GB系列是基于NVIDIA Ampere架构，是针对AI、数据分析和 HPC的GPU。GPU内存能达到80GB，GPU的带宽能达到2TB/s。
A800-40GB系列显卡是NVIDIA为了避开美国政策限制，针对中国开发的一款AI先开，GPU内存达到40GB，GPU的带宽能达到1.5TB/s。
GH200是最新的系列显卡，还没有上市，它的计算才能比A100更强，GPU内存能达到141GB包含72核的ARM芯片相比A100翻了接近一倍。
Apple
苹果公司，总部位于美国加州的库比蒂诺，与亚马逊、谷歌、微软、Meta并行为五大科技巨擘。目前的业务包括设计、研发、手机通讯和销售消费电子、计算机软件、在线服务和个人计算机。
最著名的硬件产品有iPhone智能手机、iPad平板电脑、Mac个人电脑、iPod音乐播放器、Apple Watch智能手表、Apple Vision Pro空间计算电脑、 Apple TV媒体播放器、AirPods无线耳机和HomePod智能音箱、游戏机Pippin atmark。
自有的操作系统包括:macOS、iOS、iPadOS、watchOS、tvOS和新的visionOS六大操作系统。
彭博社称，到目前为止，苹果曾经建立了本人的大型言语模型(LLM)框架，即Ajax，以及一个传闻中的聊天机器人，外部称为 Apple GPT。
Google
Google是总部位于美国加州山景城的跨国科技公司，业务范围涵盖互联网广告、互联网搜索、云计算等范畴，开发并提供大量基于互联网的产品与服务。
Google发布了PaLM 2模型，根据基准测试，PaLM 2的部分结果超越了GPT-4，PaLM 2模型提供了不同规模的四个版本，从小到大依次为"壁虎"(Gecko)，“水獭”(Otter)、“野牛”(Bison)、“独角兽”，更易于针对各种用例停止部署。
基于PaLM 2，谷歌还推出了两个专业范畴大模型。
1.谷歌健康团队打造的Med-PaLM 2，它能回答各种医学成绩。
2.面向网络安全维护的Sec-PaLM 2，它运用人工智能来协助分析和解释潜在恶意脚本的行为，并在非常短的工夫内检测哪些脚本实践上对个人和组织构成要挟。
MicroSoft
微软(Microsoft)是源自美国的跨国科技公司，总部位于美国华盛顿州的雷德蒙德，与亚马逊、苹果、谷歌、Meta并行为五大科技巨擘。其中为研发、制造、授权及提供广泛的电脑软件服务为次要业务，最为著名且畅销的产品是Microsoft Windows操作系统及Microsoft Office办公软件。
微软的AI规划次要体如今三个方面:
1.在云计算方面，微软经过投资OpenAI，将其大言语模型ChatGPT和GPT-4等集成到Azure平台上，为开发者提供便捷的AI运用开发和部署服务。
2.在办公软件方面，微软将ChatGPT-4等生成式AI才能嵌入到Microsoft 365运用程序中，如Word、Excel、PowerPoint等，经过自然言语提示，协助用户提高工作效率和创造力。
3.在搜索引擎方面，微软应用Bing的海量数据和AI技术，提升搜索结果的相关性和准确性，并推出了Bing Spotlight等新功能。
国内

华为
华为是总部位于深圳市的跨国科技公司，业务以研发和制造通讯设备、消费电子产品为主，除此之外还涉足软件开发、设计消费集成电路、光伏和电动车等跨界产品。
华为在2023年7月7日发布了盘古大模型3.0。
盘古气候大模型打破了AI预告天气精度不及传统数值预告的世界性难题，该模型是首个精度超过传统数值预告方法的AI预测模型，对比传统方法预测速度提升 10000倍，可秒级完成对全球气候的预测。
科大讯飞
科大讯飞股份有限公司，是中国深圳证券买卖所的一家上市公司，公司主营业务范围包括语音支撑软件、行业运用产品/系统、信息工程和运维服务。
2023年5月6日，科大讯飞正式发布星火认知大模型。
2023年8月15日，讯飞发布讯飞星火认知大模型V2.0。
2023年10月24日，讯飞发布讯飞星火认知大模型V3.0。
阿里巴巴
阿里巴巴集团创立于1999年，是一家以提供互联网服务为主的综合企业集团，总部位于杭州。
2023年4月7日，发布的"通义千问"大模型末尾约请测试。
2023年10月31日，云栖大会现场，阿里云正式发布千亿级参数大模型通义千问2.0。
腾讯
腾讯，是中国一家跨国企业控股公司，总部位于深圳南山区腾讯滨海大厦。腾讯业务拓展至社交、金融、投资、资讯、工具和平台等不同范畴，其子公司专门从事各种全球互联网相关服务和产品、文娱、人工智能和技术。
2023年9月7日全球数字生态大会上，腾讯正式发布自研通用大言语模型——混元。
百度
百度公司是一家次要运营搜索引擎服务的中国互联网公司，于2000年1月1日由李彦宏、徐勇两人创立于北京中关村。
2023年3月20日，百度于官方微信公布，文心一言云服务将于3月27日上线。
2023年3月27日，百度推出文心千帆，其包括百度全套文心大模型、相应的开发工具链。
2023年6月27日，百度在一份声明中表示，其最新版本的文心一言模型——文心一言3.5，在综合才能得分上超过了ChatGPT，并在多个中文功能方面表现优于GPT-4。

欢迎光临职贝云数AI新零售门户 (https://www.taojin168.com/cloud/)