最新录用
从语义洞察到商业转化-大模型赋能营销潜力挖掘的新范式研究
下载:16 浏览:142
摘要:
本研究聚焦湖北电信10001短信营业厅在意图识别上的误匹配问题,提出一套融合语义匹配与大模型推理的混合框架。用户通过短信咨询套餐变更、话费查询等业务时,由于自然语言的模糊性,现有系统常出现误匹配,既影响用户体验,也降低了企业服务效率。为解决这一难题,研究构建了智能短厅混合推理框架。在算法层面,引入 Jaccard 算法计算用户短信与标准文本的相似度,快速筛选初步匹配的业务类别;对经典的 BERT 模型进行微调,利用历史短信数据优化参数,提升语义理解能力;结合 Qwen2.5 RAG 技术,从业务知识库中检索信息,生成更准确的回复。针对训练数据不足的问题,采用同义词替换、句式变换等方法扩充数据集。同时,将 Llama 70b 模型蒸馏到 Llama1b,在减少模型体积的同时保持关键知识,降低部署成本。系统引入Jaccard算法进行初筛,结合微调BERT与Qwen2.5-RAG实现深度语义解析,并通过Llama模型蒸馏提升部署效率。在12类标签场景下,微调与蒸馏结合的方案显著提升了意图识别准确率,混合推理框架总体识别率达到77.04%,优于传统方案。
一种新型的Hilbert分形RFID标签天线
下载:51 浏览:522
基于BERT+BiLSTM+CRF深度学习模型和多元组合数据增广的渔业标准命名实体识别
下载:37 浏览:438
摘要:
为解决渔业标准命名实体识别任务中部分实体语料分布稀疏导致的效果不佳问题,提出了基于多元组合数据增广(data augmentation method based on multiple combination, MCA)的渔业标准命名实体识别方法,该方法融合了基于领域词典的联合替换算法(joint replacement algorithm based on domain dictionary, DDR)、基于槽点保护的随机删除算法(random deletion algorithm based on slot protection, SPD)和基于槽点保护的随机插入算法(random insertion algorithm based on slot protection, SPI)进行语料库的数据增广,首先构建"水产品名称"同类词词典和领域同义词词典,通过两个词典分别对"水产品名称"类实体和随机词进行同类词替换和同义词替换,生成新的句子,以增加目标实体数量和句子的多样性,然后在基于槽点保护的情况下对原句子分别进行随机删除和随机插入操作,在保留实体及上下文特征的情况下进一步丰富语料的多样性,提高模型的泛化能力。结果表明,采用基于融合注意力机制的BERT+BiLSTM+CRF网络模型和多元组合数据增广方法进行渔业标准命名实体识别,准确率、召回率、F1值分别达到了91.73%、88.64%、90.16%,具有较好的效果。研究表明,基于多元组合数据增广的渔业标准命名实体识别方法有效解决了部分实体样本稀疏问题,提升了渔业标准命名实体识别的整体效果。
基于振动分析的电机故障诊断方法
下载:394 浏览:3940