搜索 - java技术圈 - java技术社区

慕ke WeNet语音识别实战（高清完结）

获课：yinheit.xyz14842慕课 WeNet 语音识别实战指南：从数据处理到工业落地全流程解析在智能语音技术爆发式发展的今天，端到端语音识别（E2E ASR）已成为工业界主流方案。WeNet 作为由西北工业大学与出门问问联合开发的开源工具包，凭借高效的模型架构与完善的工程化支持，成为开发者构建语音识别系统的首选方案。本文将结合慕课网《WeNet 语音识别实战》课程内容，系统解析从数据预处理到模型部署的全流程技术要点。一、技术选型与架构设计（一）核心技术栈解析1. 模型架构U2++ 框架：采用双通道联合 CTC/AED 架构，通过动态块训练技术实现流式与非流式识别的统一。共享编码器支持 Conformer 或 Transformer 结构，结合双向注意力解码器引入未来上下文信息，在 ...阅读全文

博文 2025-05-24 21:16:18 Yhhyx153

阅读:2775次评论:0条 0人喜欢

深入LLM与RAG 原理、实现与应用

深入LLM与RAG 原理、实现与应用一、什么是 RAG？ RAG 全称 Retrieval-Augmented Generation，翻译成中文是检索增强生成。检索指的是检索外部知识库，增强生成指的是将检索到的知识送给大语言模型以此来优化大模型的生成结果，使得大模型在生成更精确、更贴合上下文答案的同时，也能有效减少产生误导性信息的可能。二、RAG 的流程 RAG 的中文名称是检索增强生成，从字面意思来理解，包含三个检索、增强和生成三个过程。检索：根据用户的查询内容，从外挂知识库获取相关信息。具体来说，就是将用户的查询通过嵌入模型转换成向量，以便与向量数据库中存储的知识相关的向量进行比对。通过相似性搜索，从向量数据库中找出最匹配的前 K 个数据。增强：将用户的查询内容和检索到的相关...阅读全文

博文 2024-09-26 16:58:43 woaidaqipaiqiu1122

阅读:2362次评论:0条 0人喜欢

慕ke WeNet语音识别实战（高清完结）

深入LLM与RAG 原理、实现与应用

最新评论