【华为ICT实践赛-昇腾AI赛道】【HCIA-AI-Solution】备考笔记

文章目录 隐藏

大纲

测试指标

算力

需求分析

模型评估

提示工程

华为智算方案和产品介绍

昇腾大模型解决方案概述

大模型部署与商业模式介绍

大纲

HCIA-AI-Solution应该是最简单的了

我也做了做模拟题，主要还是记忆为主，没有计算和深入理解的东西，考的也很简单，背过就行

第一次模拟635分，卡线过

破防了家人们，考试费是200USD，我以为是200元人民币，考试卷要一千二百多块钱，我一个月一共才1200的生活费，本人暂时先不考了，但文章我会更新完的o(╥﹏╥)o

华为认证-华为人才在线这是官方网站，教材，大纲，实验手册都在这里下

人工智能发展趋势

人工智能：研究开发用于模拟扩展人的只能的方法和理论 1956年约翰麦卡锡首次提出

1956年是人工智能元年

人工智能主要学派

符号主义（主流）、连接主义（仿生学派）、行为主义（进化主义）

大模型：具有大量参数和计算资源的深度学习模型，起点是Transformer（深度学习模型架构）

我们处于弱人工智能阶段

大模型特点

一、涌现：大模型突破某个规模时性能显著提升

二、逻辑推理：对输入信息进行分析

三、自然语言理解：解析理解输入的文本信息并生成有意义的自然语言来回应

四、思维链（CoT）：改进的提示策略，提高推理任务的性能。缺点是需要模型足够大，只在有限的领域效果好比如数学逻辑推理能力

五、调用工具：调用搜索引擎或数据库获取额外信息

典型大模型

T5、LLaMA、ChatGLM3（文本模型）

Stable Diffusion（文本到图像模型）

Deepseek的影响：冲击现有AI格局、推动AI技术变革、拓展AI应用市场、对算力产生影响

Deepseek的启示：算法创新、应用创新、技术共享与协同创新、降低研发成本与风险、重视AI人才培养、营造良好的人才发展环境

隐私保护：

用户：隐私条款

社会：推进隐私保护相关条款的制定

开发者：机密计算、模型隐私保护、联邦学习、对抗学习

大模型安全

输入输出侧：提示注入（通过提示词让LLM回答受限制问题）、不安全输出（输出时有可能会被劫持攻击）、Overreliance（过度依赖LLM的结果可能会出现有害结果）

传输侧：Model Denial of Service（攻击者消耗LLM的资源造成别的用户的交互质量下降）、数据泄露/模型窃取（LLM的回复意外泄露敏感信息）。

模型及服务端：训练数据投毒、过度代理、敏感信息泄露、供应链漏洞、不安全插件设计

RLHF：人类反馈强化学习，将强化学习与人类反馈相结合，通过人类的反馈来优化模型的训练。

大模型趋势与展望：多模态融合、规模与复杂度、轻量化、大小模型协同、具身智能（能够理解、推理并与物理世界交互的通用智能体）

人工智能和算力基础

人工神经网络：人工神经元组成的网络，模拟人类智能的途径

模型：根据一定的算法和数学模型实现人工智能任务的系统

深度学习流程：数据准备→数据预处理→模型训练→模型评估测试→模型部署整合

数据预处理操作：数据过滤→处理数据缺失→处理异常值→合并数据源→汇总

模型中的参数：模型自动学习，包括各个神经元的权重值，通常以矩阵呈现

模型中的超参数：一般人工手动设定，包括网络层数、神经元数量等，

测试指标

分类模型常用指标：准确率、查全率、查准率、F-score

回归模型常用指标：MAE、MSE

神经网络组成：

输入层→计算层→输出层

激活函数：将神经网络上层输出值输入到下一层的函数，让神经网络成为非线性，连续可导。

常见激活函数

Sigmoid函数：单调连续，输出有界，易收敛。容易出现梯度消失，输出不是0均值化，幂运算耗时

适合：将预测概率作为输出的模型

Tanh函数：

Softsign函数：

ReLU函数

损失函数：目标输出和实际函数间的误差函数

梯度下降：计算损失函数关于模型参数的导数（即计算损失函数的梯度)

详细的计算和过程请参考站内其它大佬对梯度下降的研究，这里就不详细阐述了，这块考试和比赛涉及的也少

神经网络计算流程

前向传播：信息从输入传到输出层然后输出预测结果。步骤是：计算上一层，整合后输出下一层

反向传播：用链式求导法则把输出层的误差回传给网格，重新权重。步骤是：根据损失函数反向传播，更新权重。

优化器：反向传播过程中加速算法收敛、避免局部最优

正则化：减少泛化误差防止过拟合的技术

常见技术有：参数添加约束例如L1、L2范数。训练集和扩充例如添加噪声，数据变换。Dropout。提前停止。Batch Normalization

典型神经网络架构

卷积神经网络CNN

图像处理神经网络，提取图像特征，实现图像分类，目标检测

包括卷积层、池化层、全连接层

核心思想：

局部感知：局部的像素联系紧密，距离远的像素相关性较弱

参数共享：卷积核的参数是固定不变的

架构：输入层→卷积层→线性整流层→池化层→全连接层→输出层

循环神经网络RNN：处理序列数据的神经网络，学习序列规律与模式，实现语音识别，自然语言处理

图神经网络GNN：处理图形数据的神经网络，实现图形数据的分类，聚类，预测

模型架构介绍

Seq2Seq：序列到序列模型

Attention机制：聚焦原序列的特定部分，即聚焦关键信息，降低无关信息关注度

Transformer模型：通过Attention机制捕捉文本特征

Transformer结构

编码器Encoder和解码器Decoder组成

输入层：位置编码、embedding层

Encoder block、Decoder block：Self-Attention层、前馈网络层，残差结构

Transformer计算流程

获取输入→Encoder→Decoder→Self-Attention→生成查询向量Q、键向量K、值向量V

Attention计算流程：

query与key进行相似度计算，得到注意力分数

权值归一化

权重与value进行加权求和

Diffusion Model扩散模型：基于概率似然的生成模型，包括前向过程和反向过程

前向扩散：模型将输入数据通过添加高斯噪声来逐渐转化为噪声数据

反向生成：模型从噪声数据中恢复出原始数据

算力

即设备的计算能力

MIPS(每秒钟执行的百万指令数，MillionInstructionsPersecond)

DMIPS(Dhrystone每秒钟执行的百万指令数，Dhrystone Milion Instructions executed Per Second)

OPS(每秒操作次数，0perationsPer Second)

FLOPS(每秒浮点运算次数，Floating-pointOperations Per second)

Hash/s(每秒哈希运算次数，HashPer Second)

FLOPS是衡量计算机运算速度的主要指标

常见数据类型

浮点数：FP64、FP32、FP16、BF16

整数：INT8、INT4

算力需求：端到端训练AI大模型的理论时间为Et=8*T*P/(n*X)

Et为端到端理论训练时间、T为训练数据的token数量、P为模型参数量、n为AI硬件卡数，X为每块卡的有效算力

AI芯片：分为训练和推理两个类型

FPGA:可编程逻辑门列阵

GPU：多核心、大吞吐量、擅长密集计算和易于并行的程序

CPU:低延时、串行处理、擅长逻辑控制与串行运算

达芬奇架构：昇腾AI处理器的core

人工智能业务流程概述

人工智能业务开发流程：

需求分析→数据收集→数据预处理→模型选择设计→模型预训练→模型评估→模型部署

大模型业务开发流程：

需求分析→数据收集→数据预处理→模型选择设计→模型预训练→模型微调和AI对齐→模型评估→模型部署

需求分析

推荐算法：电商产品、新闻推送、音乐推荐。注意力机制等

计算机视觉：目标识别、图像分类、自动驾驶。VGG、ResNet、YOLO等

自然语言处理：聊天机器人、情感分析、机器翻译、语音识别和生成。RNN、LSTM、GRU、Transformer等

超参数选择：学习率、批量大小、正则化强度、层数、节点数、dropout比率等

数据准备

数据收集-数据清洗-数据标注-划分数据集-预处理（最需要用到数据的地方）-数据分析与评估

有监督微调：SFT、Adapter Tuning、Prefix Tuning、Prompt Tuning

模型评估

评测维度：知识与能力、伦理与安全、推理能力、交互能力等

评测指标：BLEU（机器翻译）、NIST（BLEU的改进）、ROUGE（BLEU的改进）

提示工程

不需要考虑算法

思维链提示（CoT）

常见提示框架：APE、CARE、TRACE、TAG、Prompt

华为智算方案和产品介绍

PS架构——深度学习常采用的分布式训练架构

智算中心网络四个平面：参数面、样本面、业务面、带外管理面

华为天成解决方案：

昇腾大模型解决方案概述

大模型部署与商业模式介绍

文章来源于互联网:【华为ICT实践赛-昇腾AI赛道】【HCIA-AI-Solution】备考笔记

相关推荐: 告别手动统计！VX运营数据全自动生成，新增好友与转账一目了然

在微信运营的过程中，很多企业和个人都面临着一个非常繁琐的问题——如何高效、精准地统计和分析运营数据。尤其是当运营规模逐渐扩大时，手动统计的工作量和出错的风险也随之增加。微信管理系统，支持自动生成详细的运营数据报表，让您告别繁琐的手动统计工作，一目了然地掌握运…

【华为ICT实践赛-昇腾AI赛道】【HCIA-AI-Solution】备考笔记

大纲

人工智能发展趋势

人工智能主要学派

大模型特点

典型大模型

大模型安全

人工智能和算力基础

测试指标

常见激活函数

典型神经网络架构

模型架构介绍

算力

人工智能业务流程概述

需求分析

模型评估

提示工程

华为智算方案和产品介绍

昇腾大模型解决方案概述

大模型部署与商业模式介绍

相关推荐

对比kimi、通义千问、文心一言的写代码能力

热门文章

AI大模型,我们的未来