AI大模型教程
一起来学习

【华为ICT实践赛-昇腾AI赛道】【HCIA-AI-Solution】备考笔记

大纲

HCIA-AI-Solution应该是最简单的了

我也做了做模拟题,主要还是记忆为主,没有计算和深入理解的东西,考的也很简单,背过就行

第一次模拟635分,卡线过

破防了家人们,考试费是200USD,我以为是200元人民币,考试卷要一千二百多块钱,我一个月一共才1200的生活费,本人暂时先不考了,但文章我会更新完的o(╥﹏╥)o

华为认证-华为人才在线这是官方网站,教材,大纲,实验手册都在这里下

人工智能发展趋势

人工智能:研究开发用于模拟扩展人的只能的方法和理论 1956年约翰麦卡锡首次提出

1956年是人工智能元年

人工智能主要学派

符号主义(主流)、连接主义(仿生学派)、行为主义(进化主义)


大模型:具有大量参数和计算资源的深度学习模型,起点是Transformer(深度学习模型架构)

我们处于弱人工智能阶段


大模型特点

一、涌现:大模型突破某个规模时性能显著提升

二、逻辑推理:对输入信息进行分析

三、自然语言理解:解析理解输入的文本信息并生成有意义的自然语言来回应

四、思维链(CoT):改进的提示策略,提高推理任务的性能。缺点是需要模型足够大,只在有限的领域效果好比如数学逻辑推理能力

五、调用工具:调用搜索引擎或数据库获取额外信息


典型大模型

T5、LLaMA、ChatGLM3(文本模型)

Stable Diffusion(文本到图像模型)


Deepseek的影响:冲击现有AI格局、推动AI技术变革、拓展AI应用市场、对算力产生影响

Deepseek的启示:算法创新、应用创新、技术共享与协同创新、降低研发成本与风险、重视AI人才培养、营造良好的人才发展环境


隐私保护:

用户:隐私条款

社会:推进隐私保护相关条款的制定

开发者:机密计算、模型隐私保护、联邦学习、对抗学习


大模型安全

输入输出侧:提示注入(通过提示词让LLM回答受限制问题)、不安全输出(输出时有可能会被劫持攻击)、Overreliance(过度依赖LLM的结果可能会出现有害结果)

传输侧:Model Denial of Service(攻击者消耗LLM的资源造成别的用户的交互质量下降)、数据泄露/模型窃取(LLM的回复意外泄露敏感信息)。

模型及服务端:训练数据投毒、过度代理、敏感信息泄露、供应链漏洞、不安全插件设计


RLHF:人类反馈强化学习,将强化学习与人类反馈相结合,通过人类的反馈来优化模型的训练。

大模型趋势与展望:多模态融合、规模与复杂度、轻量化、大小模型协同、具身智能(能够理解、推理并与物理世界交互的通用智能体)


人工智能和算力基础

人工神经网络:人工神经元组成的网络,模拟人类智能的途径

模型:根据一定的算法和数学模型实现人工智能任务的系统

深度学习流程:数据准备→数据预处理→模型训练→模型评估测试→模型部署整合

数据预处理操作:数据过滤→处理数据缺失→处理异常值→合并数据源→汇总

模型中的参数:模型自动学习,包括各个神经元的权重值,通常以矩阵呈现

模型中的超参数:一般人工手动设定,包括网络层数、神经元数量等,

测试指标

分类模型常用指标:准确率、查全率、查准率、F-score

回归模型常用指标:MAE、MSE

神经网络组成:

输入层→计算层→输出层

激活函数:将神经网络上层输出值输入到下一层的函数,让神经网络成为非线性,连续可导。

常见激活函数

Sigmoid函数:单调连续,输出有界,易收敛。容易出现梯度消失,输出不是0均值化,幂运算耗时

适合:将预测概率作为输出的模型

Tanh函数:

Softsign函数:

ReLU函数

损失函数:目标输出和实际函数间的误差函数

梯度下降:计算损失函数关于模型参数的导数(即计算损失函数的梯度)

详细的计算和过程请参考站内其它大佬对梯度下降的研究,这里就不详细阐述了,这块考试和比赛涉及的也少

神经网络计算流程

前向传播:信息从输入传到输出层然后输出预测结果。步骤是:计算上一层,整合后输出下一层

反向传播:用链式求导法则把输出层的误差回传给网格,重新权重。步骤是:根据损失函数反向传播,更新权重。

优化器:反向传播过程中加速算法收敛、避免局部最优

正则化:减少泛化误差防止过拟合的技术

常见技术有:参数添加约束例如L1、L2范数。训练集和扩充例如添加噪声,数据变换。Dropout。提前停止。Batch Normalization

典型神经网络架构

卷积神经网络CNN

图像处理神经网络,提取图像特征,实现图像分类,目标检测

包括卷积层、池化层、全连接层

核心思想:

局部感知:局部的像素联系紧密,距离远的像素相关性较弱

参数共享:卷积核的参数是固定不变的

架构:输入层→卷积层→线性整流层→池化层→全连接层→输出层

循环神经网络RNN:处理序列数据的神经网络,学习序列规律与模式,实现语音识别,自然语言处理

图神经网络GNN:处理图形数据的神经网络,实现图形数据的分类,聚类,预测

模型架构介绍

Seq2Seq:序列到序列模型

Attention机制:聚焦原序列的特定部分,即聚焦关键信息,降低无关信息关注度

Transformer模型:通过Attention机制捕捉文本特征

Transformer结构

编码器Encoder和解码器Decoder组成

输入层:位置编码、embedding层

Encoder block、Decoder block:Self-Attention层、前馈网络层,残差结构

Transformer计算流程

获取输入→Encoder→Decoder→Self-Attention→生成查询向量Q、键向量K、值向量V

Attention计算流程:

query与key进行相似度计算,得到注意力分数

权值归一化

权重与value进行加权求和

Diffusion Model扩散模型:基于概率似然的生成模型,包括前向过程和反向过程

前向扩散:模型将输入数据通过添加高斯噪声来逐渐转化为噪声数据

反向生成:模型从噪声数据中恢复出原始数据

算力

即设备的计算能力

MIPS(每秒钟执行的百万指令数,MillionInstructionsPersecond)

DMIPS(Dhrystone每秒钟执行的百万指令数,Dhrystone Milion Instructions executed Per Second)

OPS(每秒操作次数,0perationsPer Second)

FLOPS(每秒浮点运算次数,Floating-pointOperations Per second)

Hash/s(每秒哈希运算次数,HashPer Second)

FLOPS是衡量计算机运算速度的主要指标

常见数据类型

浮点数:FP64、FP32、FP16、BF16

整数:INT8、INT4

算力需求:端到端训练AI大模型的理论时间为Et=8*T*P/(n*X)

Et为端到端理论训练时间、T为训练数据的token数量、P为模型参数量、n为AI硬件卡数,X为每块卡的有效算力

AI芯片:分为训练和推理两个类型

FPGA:可编程逻辑门列阵

GPU:多核心、大吞吐量、擅长密集计算和易于并行的程序

CPU:低延时、串行处理、擅长逻辑控制与串行运算

达芬奇架构:昇腾AI处理器的core

人工智能业务流程概述

人工智能业务开发流程:

需求分析→数据收集→数据预处理→模型选择设计→模型预训练→模型评估→模型部署

大模型业务开发流程:

需求分析→数据收集→数据预处理→模型选择设计→模型预训练→模型微调和AI对齐→模型评估→模型部署

需求分析

推荐算法:电商产品、新闻推送、音乐推荐。注意力机制等

计算机视觉:目标识别、图像分类、自动驾驶。VGG、ResNet、YOLO等

自然语言处理:聊天机器人、情感分析、机器翻译、语音识别和生成。RNN、LSTM、GRU、Transformer等

超参数选择:学习率、批量大小、正则化强度、层数、节点数、dropout比率等

数据准备

数据收集-数据清洗-数据标注-划分数据集-预处理(最需要用到数据的地方)-数据分析与评估

有监督微调:SFT、Adapter Tuning、Prefix Tuning、Prompt Tuning

模型评估

评测维度:知识与能力、伦理与安全、推理能力、交互能力等

评测指标:BLEU(机器翻译)、NIST(BLEU的改进)、ROUGE(BLEU的改进)

提示工程

不需要考虑算法

思维链提示(CoT)

常见提示框架:APE、CARE、TRACE、TAG、Prompt

华为智算方案和产品介绍

PS架构——深度学习常采用的分布式训练架构

智算中心网络四个平面:参数面、样本面、业务面、带外管理面

华为天成解决方案:

昇腾大模型解决方案概述

大模型部署与商业模式介绍

文章来源于互联网:【华为ICT实践赛-昇腾AI赛道】【HCIA-AI-Solution】备考笔记

相关推荐: 告别手动统计!VX运营数据全自动生成,新增好友与转账一目了然

在微信运营的过程中,很多企业和个人都面临着一个非常繁琐的问题——如何高效、精准地统计和分析运营数据。尤其是当运营规模逐渐扩大时,手动统计的工作量和出错的风险也随之增加。 微信管理系统,支持自动生成详细的运营数据报表,让您告别繁琐的手动统计工作,一目了然地掌握运…

赞(0)
未经允许不得转载:5bei.cn大模型教程网 » 【华为ICT实践赛-昇腾AI赛道】【HCIA-AI-Solution】备考笔记
分享到: 更多 (0)

AI大模型,我们的未来

小欢软考联系我们