文本向量化

大语言模型微调及其应用的探索 跟踪前沿的技术

文本向量化

一、文本向量化的主要挑战

Transformer是解决上述问题的关键方法!

二、文本向量化的完整流程

附图:流程示意

下面两张图为本节的可视化补充(放于文档底部以便阅读):

文本向量化的完整流程

说明:若在本地浏览器或 Markdown 渲染器中无法直接显示 SVG,请尝试用支持 SVG 的浏览器打开,或将 SVG 导出为 PNG 后插入。

文本向量化的完整流程   从 输入文本-> 分词后的文本 --> Token ID  ---> Token Embedding --> Transformer 解码器 -> 后处理 ->输出文本 完整的详细的流程  从输入‘我是学习Transformer’