本周带来的 8 个模型项目分别用于金融领域对话、中英对话、文本到音乐生成、视频理解等;2 个工具项目用于大型语言微调、多模态应用构建。
(相关资料图)
哥大开源金融大型语言模型FinGPT,以数据为中心通过自动筛选提供可靠资源和工具
哥伦比亚大学和纽约大学(上海)的研究者开发了针对金融领域的开源大型语言模型 FinGPT,该模型采用数据为中心的方法,为研究人员和从业者提供可访问和透明的资源来开发他们的 FinLLMs。FinGPT 目前提供 V1 和 V2 版本,其中 V1 基于 ChatGLM 和 LoRA 在中国金融市场数据上训练得到,V2 基于 LLaMA 和 LoRA 在美国金融实测数据上训练得到。项目提供了数据准备、数据集制作、微调和推理脚本等方便开发者使用的工具。FinGPT 为开发金融自然语言处理任务提供了高质量的金融数据资源。
获取资源:
https://sota.jiqizhixin.com/project/fingpt
百川智能开源预训练语言模型baichuan-7B,可商用、具有中英双语理解的能力
baichuan-7B 是百川智能开源的可商用大规模预训练语言模型,基于 Transformer 结构,在大约 1.2 万亿 tokens 上训练的 70 亿参数模型,支持中英双语,上下文窗口长度为 4096。为了提升训练效率,baichuan-7B 深度整合了模型算子,自适应优化了模型并行策略以及重计算策略,针对任务负载和集群配置实现了自适应优化。baichuan-7B 在 C-Eval、AGIEval 和 Gaokao 三个最具影响力的中文评估基准进行了综合评估,结果显示具有出色的中文理解能力。此外,在英文上,baichuan-7B 在 MMLU 评测结果显示,英文理解能力媲美 LLaMA-7B 和中文开源模型 ChatGLM-6B。
获取资源:
https://sota.jiqizhixin.com/project/baichuan-7b
Meta提出可控文本生成音乐模型MusicGen,能够生成符合给定和声和旋律结构的音乐
MusicGen 是一个可控的文本生成音乐模型,由 Meta AI 的研究者开发。该模型采用了通用框架和无监督旋律调节的方法,能够生成符合给定和声和旋律结构的高质量音乐样本。MusicGen 是一个单级自回归 Transformer 模型,在 32kHz EnCodec 分词器上进行训练,具有 4 个以 50Hz 采样的码本。该模型非商业用途免费使用,音频生成 PyTorch 库 Audiocraft 为 MusicGen 提供代码和模型,并提供了安装代码、模型 API 应用程序接口以及使用 API 的快速示例,方便开发者快速使用。
获取资源:
https://sota.jiqizhixin.com/project/musicgen
FlagAI大规模模型工具包,快速训练、微调、部署,高效创建多模态应用
FlagAI 是一个快速、易于使用和可扩展的大规模模型工具包,旨在支持多模态下游任务的大规模模型的训练、微调和部署。FlagAI 提供 API,可快速下载预训练模型,并在 SuperGLUE 和 CLUE 基准测试中收集的各种数据集上进行微调,支持 30 多种主流模型,包括 Aquila 语言模型、AltCLIP 多语言文本和图像表示模型、AltDiffusion Huggingface 空间的文本-图像生成模型、WuDao GLM、EVA-CLIP、BERT、RoBERTa 等。支持四种主流数据/模型并行库 PyTorch、Deepspeed、Megatron-LM、BMTrain,并提供适用于 few-shot 任务的 prompt-learning 工具包。这些模型可应用于(中英)文本分类、信息提取、问答、摘要和文本生成等任务。
获取资源:
https://sota.jiqizhixin.com/project/flagai
开源平台OpenLLM,可轻松微调、部署和监控任何开源大型语言模型,为构建AI应用提供强大支持
OpenLLM 是一个开放平台,用于在生产环境中运行大型语言模型(LLMs)。开发者可以轻松地微调、部署和监控任何开源的大型语言模型,构建强大的人工智能应用。OpenLLM 内置支持多种开源 LLM,其中包括 StableLM、Falcon、Dolly、Flan-T5、ChatGLM、StarCoder 等,让开发者可以选择适合自己的 LLM。同时,OpenLLM 支持 LangChain 和 BentoML,让开发者可以将 LLMs 与其他模型和服务组合起来创建自己的人工智能应用。
获取资源:
https://sota.jiqizhixin.com/project/openllm
穆罕默德·本·扎耶德人工智能大学提出视频对话模型Video-ChatGPT, 能够理解和生成关于视频的详细对话
视频对话模型 Video-ChatGPT,能够理解和生成关于视频的详细对话。该模型通过在视频指令数据上微调,捕捉视频数据中的时间动态和帧间一致性关系,从而能够以连贯方式进行有关视频内容的开放式对话。此外,项目还提供了 10 万个视频-指令对的数据集以及环境安装命令、获取 LLaVA 权重脚本、数据集格式转换脚本、训练代码等工具。Video-ChatGPT 将为视频理解应用领域的开发者提供强大的支持。
获取资源:
https://sota.jiqizhixin.com/project/video-chatgpt
微软发布医学多模态大模型LLaVA-Med,基于LLaVA的医学指令微调,为生物医学图像开放问题提供视觉语言对话
微软发布医学多模态大型模型 LLaVA-Med,用于生物医学图像开放性研究问题的视觉-语言对话。LLaVA-Med 基于 LLaVA 的医学指令微调,并使用了一种成本效益高的方法,利用从 PubMed Central 提取的大规模、广覆盖的生物医学图题数据集进行训练。该模型能够根据开放性指令辅助回答关于生物医学图像的问题,并展现出优秀的多模态对话能力。在三个标准生物医学视觉问答数据集上,微调 LLaVA-Med 在某些指标上优于先前的监督式最先进方法。为了促进生物医学多模态研究,微软将发布指令遵循数据和 LLaVA-Med 模型。
获取资源:
https://sota.jiqizhixin.com/project/llava-med
英伟达提出新型混合CNN-ViT神经网络FasterViT,在精度与图像吞吐量上表现出优越的性能
视觉 Transformers 在计算机视觉领域中备受欢迎,取得了卓越的性能。然而,在真实的 ViT 模型中仍存在归纳能力不足的问题,导致可能需要更多的训练数据来弥补偏差。因此,英伟达的研究者提出了一种新型混合 CNN-ViT 神经网络 FasterViT,重点关注计算机视觉应用中的高图像吞吐量,表现出了在精度和图像吞吐量上优越的性能。该项目提供了依赖项安装命令、ImageNet-1K 训练代码、ImageNet-1K 预训练模型、详细的模型训练方法以及所使用的评估代码。
获取资源:
https://sota.jiqizhixin.com/project/fastervit
开源中文大型语言模型OpenLLaMA-Chinese,提供中英文指令微调权重,支持自然语言生成和对话系统开发
OpenLLaMA-Chinese 是基于 OpenLLaMA 构建的,OpenLLaMA 是 Meta 的 LLaMA 7B 和 13B 模型的开源再现,使用 RedPajama 数据集进行训练。OpenLLaMA-Chinese 使用了 OpenLLaMA 基础模型,并进行了中英文指令微调,并公开了模型的权重。当前项目开放中文指令微调权重、英文指令微调权重以及中英文指令微调权重。OpenLLaMA-Chinese 可以用于开发自然语言生成、对话系统等应用,没有任何使用限制。
获取资源:
https://sota.jiqizhixin.com/project/openllama-chinese
编程大型模型WizardCoder开源,采用Evol-Instruct方法开发,高性能编程、支持微调和推理任务
编程大型模型(Code LLM)WizardCoder,采用 Evol-Instruct 方法开发,专门用于编程任务。WizardCoder-15B-v1.0 模型在 HumanEval 基准测试中取得了 57.3%的 pass@1 得分,比开源 Code LLMs 高出了 22.3 个百分点。相比闭源模型,WizardCoder 具有更小的模型大小,并在 HumanEval 和 MBPP 基准测试中表现出显著的性能优势。WizardCoder 的代码和模型托管于 huggingface,当前项目提供部署环境配置代码、模型权重、模型训练代码和模型文件,帮助开发者进行微调、推理等开发任务。
获取资源:
https://sota.jiqizhixin.com/project/wizardcoder
网页端访问:在浏览器地址栏输入新版站点地址 sota.jiqizhixin.com ,即可前往「SOTA!模型」平台,查看关注的模型是否有新资源收录。
移动端访问:在微信移动端中搜索服务号名称「机器之心SOTA模型」或 ID 「sotaai」,关注 SOTA!模型服务号,即可通过服务号底部菜单栏使用平台功能,更有最新AI技术、开发资源及社区动态定期推送。
标签:
-
中国金融市场数据LoRA模型FinGPT开源(基于ChatGLM);王小川团队开源7B中英对话模型
看看本周新进展本周带来的8个模型项目分别用于金融领域对话、中英对话
-
2023年618收官喜讯 哈趣投影荣获LCD投影榜第1名
2023年618迎来收官战,各大品牌销售业绩又添新能量。国内头部千元投影
-
重点聚焦!中国有色金属工业协会:5月中国钨钼产业景气指数为25.4
据中国有色金属工业协会6月19日消息,中国钨钼产业月度景气指数监测结
-
赣锋锂业成立先进能源与材料研究公司 注册资本3000万_世界热点
天眼查App显示,近日,赣锂先进能源与材料研究(北京)有限公司成立,
-
天天日报丨维肤宁膏丨荨麻疹反复发作怎么办?
随着饮食的改变,生活方式的变化,人体也出现了诸多情况,荨麻疹就
-
京东到家“6·18”合作门店数同比增长80%_每日热讯
京东到家“6·18”合作门店数同比增长80%
-
当前热讯:人民网评:备战电力迎峰度夏,为生产生活保驾护航
模拟华东四省一市发生大面积停电事件,协调指导电力管理、能源监管等部
-
纳乔:补招入国家队让我措手不及 场上我比其他球员干多两倍事情-全球微头条
纳乔:补招入国家队让我措手不及场上我比其他球员干多两倍事情,单刀,拿
-
天天视讯!【在希望的田野上】抢抓农时 各地夏收夏种压茬推进
消息(新闻联播):全国麦收进入尾声,各地抢抓农时,科学高效统筹调度
-
精彩的CUBAL决赛背后是热度攀升的大学校园篮球
京报体育|记者卓然当全场比赛还剩4分钟时,广东工业大学男篮还落后8分
-
每日快播:陈雨菲世界排名升至第三!刘欧组合掉至第八,女双混双仍占据榜首
何冰娇继续排名第五,韩悦上升1位至第九,并正式超越王祉怡,成为国羽
-
贵阳多地遭遇大暴雨:消防紧急营救4人、疏散被困人员31人
6月18日傍晚至19日早晨,贵州省贵阳市多地出现暴雨、大暴雨天气。
-
眼镜鼻托正确位置图片大全_眼镜鼻托最合适位置|天天资讯
1、市面上大部分带鼻垫的眼镜都是为亚洲人设计的。因为亚洲人的鼻子没
-
2024年属牛人小人生肖,如何防备
属牛人在2024年将面临小人生肖的挑战,这些小人可能会对他们的事业、财
-
孙宏斌解开了融创中国的困局?_天天讯息
斑马消费杨柘在房地产行业里,孙宏斌历来是白马骑士般的存在。它曾出手
-
广州“院士专家校园行”活动已开展科普讲座658场|报道
自2017年起,广州市科学技术协会持续打造“院士专家校园行”品牌项目,
-
环球观热点:现实题材爱情电影《我爱你!》6月21日全国公映,韩延解析创作初衷
讲述了本片导演韩延的创作心路历程,他将社会对于“衰老的恐惧”融入创
-
iphone4s序列号查询真伪(iphone4s序列号查询)_今日播报
1、滑动以解锁iPhone2、单击设置。3、进入设置页面。4、进入设置页面后
-
环球即时:航天长峰 (600855):6月19日该股突破长期盘整
股价突破长期盘整:前30日在上下30%的幅度内整理,今日有效突破。资金
-
杠杆资金重仓股曝光 双环传动居首-世界热资讯
Wind统计显示,上一交易日(6月17日)共有1432只个股获融资净买入,净
-
两市融资余额减少27.39亿元 视焦点讯
截至6月16日,上交所融资余额报7885 91亿元,较前一交易日减少17 36亿
-
热推荐:车门胶条嘎吱响怎么办_车门胶条摩擦异响怎么办
门带摩擦产生异响的处理方法如下:1。检查门的缝隙大小:门与门的缝隙
-
环球速递!奇异的近义词(奇异的近义词是什么)
异的近义词,奇异的近义词是什么很多人还不知道,现在让我们一起来看看
-
重实效 强实干 抓落实丨喜报!大藤峡工程右岸第四台机组正式投产发电_天天微速讯
6月18日20时,大藤峡工程右岸第四台机组(4号机组)顺利通过72小时试运
-
中央气象台:杭州湾和长江口附近海域将有雷暴大风
杭州湾和长江口附近海域将有雷暴大风
-
实习招聘会变身就业指导“练兵场”
光明日报记者苏雁光明日报通讯员胡振宇张青“宽哥,听了您的就业指导课
-
世界动态:特效法力药水多少级怪掉落 特效法力药水配方哪买
1、是在通灵学院的幽灵NPC那里,你首先需要做好前序任务才可以,任务NP
-
简讯:华宇软件接待百年保险资管等多家机构调研
华宇软件接待百年保险资管等多家机构调研
-
招招早餐的加盟流程介绍_全球关注
作为早餐行业的知名品牌,招招早餐一直致力于提供健康、美味、方便的早
-
全球焦点!baiduplayer.mp4(baiduplayer)
来为大家解答以上问题,baiduplayer mp4,baiduplayer很多人还不知道,