首页 新闻中心 企业动态 格灵深瞳受邀参加RWKV开发者大会

格灵深瞳受邀参加RWKV开发者大会

来源格灵深瞳 作者格灵深瞳 发布时间2025-02-28
近日,RWKV社区在上海漕河泾举办了主题为《RWKV-7与未来趋势》的开发者大会,来自全国各地的开发者、行业专家和技术创新者齐聚一堂,共同交流和探讨后Transformer时代的AI新架构和新的发展方向。格灵深瞳算法工程师杨铠成受邀参会并发表了《RWKV-CLIP:一个鲁棒的视觉-语言表征学习器》的主题演讲。

771e14f824fbd0c4dad39eba3bdfc482.jpg

据悉,RWKV是国产开源的首个非Transformer架构的大语言模型,结合了RNN和Transformer的相关特性:出色的性能、快速的推理、快速的训练、节省VRAM、“无限” 的ctxlen和免费的句嵌入,而且100% 不含自注意力机制。

杨铠成谈到,在大模型时代背景下,RWKV架构得益于其在长上下文背景下的高效训练和推理能力,得到了广泛的关注。伴随着RWKV、Mamba等架构的爆火,格灵深瞳第一时间将这类架构应用到图文表征学习任务中,并构建了RWKV-CLIP模型,在相同的预训练数据以及预训练参数设置下,RWKV-CLIP相较于基于Transformer架构的CLIP模型,在线性探测、零样本分类、零样本检索等任务中展示出了显著的性能提升。相关论文目前已被EMNLP 2024主会录用,相关训练代码、数据均已开源。

Github主页:https://github.com/deepglint/RWKV-CLIP

Huggingface数据:https://huggingface.co/datasets/Kaichengalex/YFCC15M

作为行业领先的人工智能公司,格灵深瞳高度重视与社区和学术领域的交流合作。近日,格灵深瞳还发布了亿级规模的图文预训练RealSyn数据集,通过构建一种高效的数据清洗和转换范式,将图文交错文档转换为图文对比学习可高效使用的图文对数据。目前相关论文与数据集均已开源。

论文:https://arxiv.org/pdf/2502.12513

项目主页:https://garygutc.github.io/RealSyn

Github地址:https://github.com/deepglint/RealSyn

HuggingFace数据集:https://huggingface.co/datasets/Kaichengalex/RealSyn100M


更多精彩内容
即刻开启企业AI之旅
该信息仅用于格灵深瞳与您沟通以及了解您的业务需求,如您不同意提供个人信息,请关闭本表单页面。
*联系人:
*联系电话:
*联系邮箱:
*获取验证码:
点击获取验证码
立即提交
提交成功
感谢提交,近期将有格灵深瞳工作人员与您取得联系, 请您保持电话畅通。
资料下载
*姓名:
*手机号:
*邮箱:
*获取验证码:
点击获取验证码
*公司名称:
*职位:
*您是否有其他具体的业务需求?
是,请尽快与我取得联系
否,暂时无其他需求
立即下载