中国金融市场数据LoRA模型FinGPT开源（基于ChatGLM）；王小川团队开源7B中英对话模型

来源：哔哩哔哩时间：2023-06-19 18:29:24

本周带来的 8 个模型项目分别用于金融领域对话、中英对话、文本到音乐生成、视频理解等；2 个工具项目用于大型语言微调、多模态应用构建。

(相关资料图)

哥大开源金融大型语言模型FinGPT，以数据为中心通过自动筛选提供可靠资源和工具

哥伦比亚大学和纽约大学（上海）的研究者开发了针对金融领域的开源大型语言模型 FinGPT，该模型采用数据为中心的方法，为研究人员和从业者提供可访问和透明的资源来开发他们的 FinLLMs。FinGPT 目前提供 V1 和 V2 版本，其中 V1 基于 ChatGLM 和 LoRA 在中国金融市场数据上训练得到，V2 基于 LLaMA 和 LoRA 在美国金融实测数据上训练得到。项目提供了数据准备、数据集制作、微调和推理脚本等方便开发者使用的工具。FinGPT 为开发金融自然语言处理任务提供了高质量的金融数据资源。

获取资源：

https://sota.jiqizhixin.com/project/fingpt

百川智能开源预训练语言模型baichuan-7B，可商用、具有中英双语理解的能力

baichuan-7B 是百川智能开源的可商用大规模预训练语言模型，基于 Transformer 结构，在大约 1.2 万亿 tokens 上训练的 70 亿参数模型，支持中英双语，上下文窗口长度为 4096。为了提升训练效率，baichuan-7B 深度整合了模型算子，自适应优化了模型并行策略以及重计算策略，针对任务负载和集群配置实现了自适应优化。baichuan-7B 在 C-Eval、AGIEval 和 Gaokao 三个最具影响力的中文评估基准进行了综合评估，结果显示具有出色的中文理解能力。此外，在英文上，baichuan-7B 在 MMLU 评测结果显示，英文理解能力媲美 LLaMA-7B 和中文开源模型 ChatGLM-6B。

获取资源：

https://sota.jiqizhixin.com/project/baichuan-7b

Meta提出可控文本生成音乐模型MusicGen，能够生成符合给定和声和旋律结构的音乐

MusicGen 是一个可控的文本生成音乐模型，由 Meta AI 的研究者开发。该模型采用了通用框架和无监督旋律调节的方法，能够生成符合给定和声和旋律结构的高质量音乐样本。MusicGen 是一个单级自回归 Transformer 模型，在 32kHz EnCodec 分词器上进行训练，具有 4 个以 50Hz 采样的码本。该模型非商业用途免费使用，音频生成 PyTorch 库 Audiocraft 为 MusicGen 提供代码和模型，并提供了安装代码、模型 API 应用程序接口以及使用 API 的快速示例，方便开发者快速使用。

获取资源：

https://sota.jiqizhixin.com/project/musicgen

FlagAI大规模模型工具包，快速训练、微调、部署，高效创建多模态应用

FlagAI 是一个快速、易于使用和可扩展的大规模模型工具包，旨在支持多模态下游任务的大规模模型的训练、微调和部署。FlagAI 提供 API，可快速下载预训练模型，并在 SuperGLUE 和 CLUE 基准测试中收集的各种数据集上进行微调，支持 30 多种主流模型，包括 Aquila 语言模型、AltCLIP 多语言文本和图像表示模型、AltDiffusion Huggingface 空间的文本-图像生成模型、WuDao GLM、EVA-CLIP、BERT、RoBERTa 等。支持四种主流数据/模型并行库 PyTorch、Deepspeed、Megatron-LM、BMTrain，并提供适用于 few-shot 任务的 prompt-learning 工具包。这些模型可应用于（中英）文本分类、信息提取、问答、摘要和文本生成等任务。

获取资源：

https://sota.jiqizhixin.com/project/flagai

开源平台OpenLLM，可轻松微调、部署和监控任何开源大型语言模型，为构建AI应用提供强大支持

OpenLLM 是一个开放平台，用于在生产环境中运行大型语言模型（LLMs）。开发者可以轻松地微调、部署和监控任何开源的大型语言模型，构建强大的人工智能应用。OpenLLM 内置支持多种开源 LLM，其中包括 StableLM、Falcon、Dolly、Flan-T5、ChatGLM、StarCoder 等，让开发者可以选择适合自己的 LLM。同时，OpenLLM 支持 LangChain 和 BentoML，让开发者可以将 LLMs 与其他模型和服务组合起来创建自己的人工智能应用。

获取资源：

https://sota.jiqizhixin.com/project/openllm

穆罕默德·本·扎耶德人工智能大学提出视频对话模型Video-ChatGPT，能够理解和生成关于视频的详细对话

视频对话模型 Video-ChatGPT，能够理解和生成关于视频的详细对话。该模型通过在视频指令数据上微调，捕捉视频数据中的时间动态和帧间一致性关系，从而能够以连贯方式进行有关视频内容的开放式对话。此外，项目还提供了 10 万个视频-指令对的数据集以及环境安装命令、获取 LLaVA 权重脚本、数据集格式转换脚本、训练代码等工具。Video-ChatGPT 将为视频理解应用领域的开发者提供强大的支持。

获取资源：

https://sota.jiqizhixin.com/project/video-chatgpt

微软发布医学多模态大模型LLaVA-Med，基于LLaVA的医学指令微调，为生物医学图像开放问题提供视觉语言对话

微软发布医学多模态大型模型 LLaVA-Med，用于生物医学图像开放性研究问题的视觉-语言对话。LLaVA-Med 基于 LLaVA 的医学指令微调，并使用了一种成本效益高的方法，利用从 PubMed Central 提取的大规模、广覆盖的生物医学图题数据集进行训练。该模型能够根据开放性指令辅助回答关于生物医学图像的问题，并展现出优秀的多模态对话能力。在三个标准生物医学视觉问答数据集上，微调 LLaVA-Med 在某些指标上优于先前的监督式最先进方法。为了促进生物医学多模态研究，微软将发布指令遵循数据和 LLaVA-Med 模型。

获取资源：

https://sota.jiqizhixin.com/project/llava-med

英伟达提出新型混合CNN-ViT神经网络FasterViT，在精度与图像吞吐量上表现出优越的性能

视觉 Transformers 在计算机视觉领域中备受欢迎，取得了卓越的性能。然而，在真实的 ViT 模型中仍存在归纳能力不足的问题，导致可能需要更多的训练数据来弥补偏差。因此，英伟达的研究者提出了一种新型混合 CNN-ViT 神经网络 FasterViT，重点关注计算机视觉应用中的高图像吞吐量，表现出了在精度和图像吞吐量上优越的性能。该项目提供了依赖项安装命令、ImageNet-1K 训练代码、ImageNet-1K 预训练模型、详细的模型训练方法以及所使用的评估代码。

获取资源：

https://sota.jiqizhixin.com/project/fastervit

开源中文大型语言模型OpenLLaMA-Chinese，提供中英文指令微调权重，支持自然语言生成和对话系统开发

OpenLLaMA-Chinese 是基于 OpenLLaMA 构建的，OpenLLaMA 是 Meta 的 LLaMA 7B 和 13B 模型的开源再现，使用 RedPajama 数据集进行训练。OpenLLaMA-Chinese 使用了 OpenLLaMA 基础模型，并进行了中英文指令微调，并公开了模型的权重。当前项目开放中文指令微调权重、英文指令微调权重以及中英文指令微调权重。OpenLLaMA-Chinese 可以用于开发自然语言生成、对话系统等应用，没有任何使用限制。

获取资源：

https://sota.jiqizhixin.com/project/openllama-chinese

编程大型模型WizardCoder开源，采用Evol-Instruct方法开发，高性能编程、支持微调和推理任务

编程大型模型（Code LLM）WizardCoder，采用 Evol-Instruct 方法开发，专门用于编程任务。WizardCoder-15B-v1.0 模型在 HumanEval 基准测试中取得了 57.3%的 pass@1 得分，比开源 Code LLMs 高出了 22.3 个百分点。相比闭源模型，WizardCoder 具有更小的模型大小，并在 HumanEval 和 MBPP 基准测试中表现出显著的性能优势。WizardCoder 的代码和模型托管于 huggingface，当前项目提供部署环境配置代码、模型权重、模型训练代码和模型文件，帮助开发者进行微调、推理等开发任务。

获取资源：

https://sota.jiqizhixin.com/project/wizardcoder

网页端访问：在浏览器地址栏输入新版站点地址 sota.jiqizhixin.com ，即可前往「SOTA！模型」平台，查看关注的模型是否有新资源收录。

移动端访问：在微信移动端中搜索服务号名称「机器之心SOTA模型」或 ID 「sotaai」，关注 SOTA！模型服务号，即可通过服务号底部菜单栏使用平台功能，更有最新AI技术、开发资源及社区动态定期推送。

标签：

最近更新

中国金融市场数据LoRA模型FinGPT开源（基于ChatGLM）；王小川团队开源7B中英对话模型

看看本周新进展本周带来的8个模型项目分别用于金融领域对话、中英对话

时间：2023-06-19 18:29:24
2023年618收官喜讯哈趣投影荣获LCD投影榜第1名

2023年618迎来收官战，各大品牌销售业绩又添新能量。国内头部千元投影

时间：2023-06-19 18:00:19
重点聚焦!中国有色金属工业协会：5月中国钨钼产业景气指数为25.4

据中国有色金属工业协会6月19日消息，中国钨钼产业月度景气指数监测结

时间：2023-06-19 17:19:34
赣锋锂业成立先进能源与材料研究公司注册资本3000万_世界热点

天眼查App显示，近日，赣锂先进能源与材料研究（北京）有限公司成立，

时间：2023-06-19 16:57:36
天天日报丨维肤宁膏丨荨麻疹反复发作怎么办？

随着饮食的改变，生活方式的变化，人体也出现了诸多情况，荨麻疹就

时间：2023-06-19 16:40:13
京东到家“6·18”合作门店数同比增长80%_每日热讯

京东到家“6·18”合作门店数同比增长80%

时间：2023-06-19 16:08:15
当前热讯：人民网评：备战电力迎峰度夏，为生产生活保驾护航

模拟华东四省一市发生大面积停电事件，协调指导电力管理、能源监管等部

时间：2023-06-19 15:34:20
纳乔：补招入国家队让我措手不及场上我比其他球员干多两倍事情-全球微头条

纳乔：补招入国家队让我措手不及场上我比其他球员干多两倍事情,单刀,拿

时间：2023-06-19 15:02:46
天天视讯！【在希望的田野上】抢抓农时各地夏收夏种压茬推进

消息（新闻联播）：全国麦收进入尾声，各地抢抓农时，科学高效统筹调度

时间：2023-06-19 14:47:40
精彩的CUBAL决赛背后是热度攀升的大学校园篮球

京报体育|记者卓然当全场比赛还剩4分钟时，广东工业大学男篮还落后8分

时间：2023-06-19 13:54:44
每日快播：陈雨菲世界排名升至第三！刘欧组合掉至第八，女双混双仍占据榜首

何冰娇继续排名第五，韩悦上升1位至第九，并正式超越王祉怡，成为国羽

时间：2023-06-19 13:32:37
贵阳多地遭遇大暴雨：消防紧急营救4人、疏散被困人员31人

6月18日傍晚至19日早晨，贵州省贵阳市多地出现暴雨、大暴雨天气。

时间：2023-06-19 12:52:08
眼镜鼻托正确位置图片大全_眼镜鼻托最合适位置|天天资讯

1、市面上大部分带鼻垫的眼镜都是为亚洲人设计的。因为亚洲人的鼻子没

时间：2023-06-19 12:00:48
2024年属牛人小人生肖，如何防备

属牛人在2024年将面临小人生肖的挑战，这些小人可能会对他们的事业、财

时间：2023-06-19 11:41:17
孙宏斌解开了融创中国的困局？_天天讯息

斑马消费杨柘在房地产行业里，孙宏斌历来是白马骑士般的存在。它曾出手

时间：2023-06-19 11:09:02
广州“院士专家校园行”活动已开展科普讲座658场|报道

自2017年起，广州市科学技术协会持续打造“院士专家校园行”品牌项目，

时间：2023-06-19 10:48:13
环球观热点：现实题材爱情电影《我爱你！》6月21日全国公映，韩延解析创作初衷

讲述了本片导演韩延的创作心路历程，他将社会对于“衰老的恐惧”融入创

时间：2023-06-19 10:34:16
iphone4s序列号查询真伪（iphone4s序列号查询）_今日播报

1、滑动以解锁iPhone2、单击设置。3、进入设置页面。4、进入设置页面后

时间：2023-06-19 10:06:17
环球即时：航天长峰（600855）：6月19日该股突破长期盘整

股价突破长期盘整：前30日在上下30%的幅度内整理，今日有效突破。资金

时间：2023-06-19 09:55:55
杠杆资金重仓股曝光双环传动居首-世界热资讯

Wind统计显示，上一交易日（6月17日）共有1432只个股获融资净买入，净

时间：2023-06-19 09:43:43
两市融资余额减少27.39亿元视焦点讯

截至6月16日，上交所融资余额报7885 91亿元，较前一交易日减少17 36亿

时间：2023-06-19 09:37:17
热推荐：车门胶条嘎吱响怎么办_车门胶条摩擦异响怎么办

门带摩擦产生异响的处理方法如下：1。检查门的缝隙大小：门与门的缝隙

时间：2023-06-19 09:41:10
环球速递！奇异的近义词（奇异的近义词是什么）

异的近义词，奇异的近义词是什么很多人还不知道，现在让我们一起来看看

时间：2023-06-19 09:17:43
重实效强实干抓落实丨喜报！大藤峡工程右岸第四台机组正式投产发电_天天微速讯

6月18日20时，大藤峡工程右岸第四台机组（4号机组）顺利通过72小时试运

时间：2023-06-19 09:18:29
中央气象台：杭州湾和长江口附近海域将有雷暴大风

杭州湾和长江口附近海域将有雷暴大风

时间：2023-06-19 09:20:16
实习招聘会变身就业指导“练兵场”

光明日报记者苏雁光明日报通讯员胡振宇张青“宽哥，听了您的就业指导课

时间：2023-06-19 08:53:46
世界动态:特效法力药水多少级怪掉落特效法力药水配方哪买

1、是在通灵学院的幽灵NPC那里，你首先需要做好前序任务才可以，任务NP

时间：2023-06-18 22:21:42
简讯：华宇软件接待百年保险资管等多家机构调研

华宇软件接待百年保险资管等多家机构调研

时间：2023-06-18 21:27:40
招招早餐的加盟流程介绍_全球关注

作为早餐行业的知名品牌，招招早餐一直致力于提供健康、美味、方便的早

时间：2023-06-18 21:00:00
全球焦点！baiduplayer.mp4（baiduplayer）

来为大家解答以上问题，baiduplayer mp4，baiduplayer很多人还不知道，

时间：2023-06-18 19:59:30

X 关闭

滚动

专家

江苏出台20条助企纾困措施助力外贸外资平稳发展

“弄虚作假”现象频现常州4家保险公司被罚

X 关闭

滚动