OpenBayes

获赞数

关注数

粉丝数

北京

openbayes.com

IP 属地北京

2023-01-09 加入

浏览 4.9k

主页回答提问文章118

贝式计算是中国领先的高性能计算服务提供商，通过为新一代异构芯片嫁接经典软件生态及机器学习模型，向工业企业及高效科研院所提供更加快速、易用的数据科学计算产品。

6 声望

2022-年度总结

人工智能

segmentfault

黄金勋章

暂未获得该勋章

如何获得

白银勋章

暂未获得该勋章

如何获得

青铜勋章

暂未获得该勋章

如何获得

个人动态

发布了文章6 月 26 日
OpenBayes 一周速览丨Nanonets-OCR-s深度语义理解；HLE人类问题推理基准上线，助力封闭式评估体系构建
 OpenBayes
公共资源速递5 个公共数据集：* Brain Tumor 脑肿瘤数据集* HLE 人类问题推理基准数据集* OpenThoughts3-1.2M 推理数据集* Nemotron-Personas 人物角色数据集* OpenMathReasoning 数学推理数据集14 个公共教程：音频生成 * 2视频生成 * 2OCR 识别 * 2大模型部署 * 8...
发布了文章6 月 26 日
OpenBayes 在线教程丨MonkeyOCR-3B 在英文文档解析任务上超越 72B 模型，性能达 SOTA
OpenBayes
如今，OCR（光学字符识别）技术早已不再局限于文字识别，而正逐步演化为更复杂的文档解析系统。从最初的简单字符提取，到近年来兴起的多模态大模型，OCR 已融入了版面理解、语义识别与结构还原等任务，在文档识别、字幕识别、物流分拣、文献资料检索等领域广泛落地，...
发布了文章6 月 20 日
OpenBayes 一周速览丨「小红书味」超重的大模型 dots.llm1 开源；UniDepthV2 助力3D场景设计
 OpenBayes
公共资源速递6 个公共数据集：LEXam 法律推理基准数据集Llamg-Nemotron 推理数据集DeepTheorem 定理证明数据集Eye Detection 眼睛检测数据集OpenCodeReasoning 编程推理数据集GeneralThought-430K 大规模推理数据集2 个公共模型：MiniMind2dots.llm1.inst11 个公共教...
发布了文章6 月 20 日
OpenBayes 教程上新丨获 CVPR 2025 最佳论文，通用 3D 视觉模型 VGGT 推理速度可达秒级
 OpenBayes
6 月 13 日，全球计算机视觉三大顶级会议之一 CVPR 2025 公布了最佳论文等奖项。根据官方数据，CVPR 2025 共收到了超 4 万名作者提交的 13,008 篇论文，相较去年的投稿数量增长了 13%，大会最终接收论文 2,872 篇，整体接受率约为 22.1%。
发布了文章6 月 20 日
OpenBayes 教程上新丨获 CVPR 2025 最佳论文，通用 3D 视觉模型 VGGT 推理速度可达秒级
 OpenBayes
6 月 13 日，全球计算机视觉三大顶级会议之一 CVPR 2025 公布了最佳论文等奖项。根据官方数据，CVPR 2025 共收到了超 4 万名作者提交的 13,008 篇论文，相较去年的投稿数量增长了 13%，大会最终接收论文 2,872 篇，整体接受率约为 22.1%。
发布了文章6 月 13 日
OpenBayes 一周速览丨对标GPT-4o! BAGEL统一处理多模态数据理解和生成任务
 OpenBayes
公共资源速递2 个公共模型：BAGEL-7B-MoTQwen3 Embedding-0.6B & Reranker-0.6B13 个公共教程：大模型 * 2AI for Science * 5多模态理解与生成 * 6访问官网立即使用：[链接]公共模型1. BAGEL-7B-MoT* 发布机构：字节跳动 Seed 团队BAGEL-7B-MoT 模型采用混合 Trans...
发布了文章6 月 13 日
OpenBayes 教程上新丨刷新TTS模型SOTA，OpenAudio S1基于200万小时音频数据训练，深刻语音细节
 OpenBayes
近年来，TTS（Text-to-Speech，文本转语音）模型经历了从拼接式语音合成到统计参数合成，再到神经网络 TTS（Neural TTS）的迭代，在技术层面呈现出端到端、模块融合的趋势，在应用层面呈现出多语言、高自然度、丰富情感变化的效果升级。
发布了文章6 月 5 日
OpenBayes 一周速览｜TransPixeler 实现透明化文本到视频生成；统一图像定制框架 DreamO 上线
 OpenBayes
公共资源速递2 个公共数据集：*s1K-1.1 数学推理数据集*HPA 人类蛋白质图谱数据集3 个公共模型： * MedGemma-4B-IT* Devstral-Small-2505* DeepSeek-Prover-V2-7B12 个公共教程：视频生成 * 2语音交互 * 3代码生成 * 3图像生成编辑 * 4访问官网立即使用： openbayes...
发布了文章6 月 5 日
OpenBayes 教程上新丨新加坡国立大学 Show Lab 发布 OmniConsistency，实现即插即用的图像风格迁移
 OpenBayes
图像风格化旨在通过风格化模型，将一幅图像在保持语义内容不变的同时从一种风格转换到另一种风格。近年随着扩散模型的出现，主流图像风格化方法从基于深度神经网络，转向了通过低秩适配（Low-Rank Adaptation, LoRA）微调的方法，并结合图像一致性模块，显著提升了风...
发布了文章5 月 29 日
OpenBayes 教程上新丨谷歌发布 MedGemma，基于 Gemma 3 构建，专攻医学文本与图像理解
 OpenBayes
在 Google I/O 2025 大会上，公司 CEO Sundar Pichai 在活动首日的主题演讲中便分享了多项创新，例如 Gemini 2.5 的全系列升级，Agent Mode 上线 Chrome，编码智能体 Jules 开启公测，Android XR 正式版亮相等等。而在一众令人眼花缭乱的重磅更新之中，还隐藏着一个...
发布了文章5 月 29 日
OpenBayes 一周速览｜Kimi-Audio 更能识别情感的语音模型；Orpheus-TTS 零样本克隆语音
 OpenBayes
公共资源速递9 个教程：大模型 * 2使用 vLLM+Open WebUI 部署 DeepSeek-Prover-V2-7B使用 vLLM+Open WebUI 部署 OpenMath-Nemotron-1.5B图像处理 * 3KV-Edit 背景一致性图像编辑StarVector 像素图转矢量图 AI 模型In-Context Edit：指令驱动图像生成与编辑音频生成 *...
发布了文章5 月 22 日
OpenBayes 一周速览丨vLLM 实战教程汇总，从环境配置到大模型部署，中文文档追踪重磅更新
 OpenBayes
随着大语言模型（LLM）逐步走向工程化与规模化部署，其推理效率、资源利用率以及硬件适配能力正成为影响应用落地的核心问题。2023 年，加州大学伯克利分校的研究团队开源 vLLM，通过引入 PagedAttention 机制对 KV 缓存进行高效管理，显著提升模型吞吐量与响应速度，...
发布了文章5 月 15 日
OpenBayes 教程上新丨9 秒处理一张图！In-Context Edit 高效图像编辑框架上线
 OpenBayes
现有的图像编辑方法主要面临精度与效率之间难以平衡的问题。微调方法需要大量的计算资源和优质数据集，而无需训练的技术则难以满足指令理解和编辑质量。对此，浙江大学和哈佛大学的研究团队推出了 In-Context Edit（ICEdit），一款基于指令的图像编辑框架，仅需极少...
发布了文章5 月 9 日
OpenBayes 教程上新丨ControlNet 作者开源新作！低门槛生成长视频，FramePack 革新视频生成
 OpenBayes
FramePack 是由 ControlNet 作者、斯坦福大学博士生张吕敏 (Lvmin Zhang) 团队近期开源的视频生成框架，它通过创新的神经网络架构，有效解决了传统视频生成中显存占用高、漂移和遗忘等问题。
发布了文章5 月 8 日
OpenBayes 一周速览丨 InstantCharacter单图完成角色个性化创作
 OpenBayes
公共资源速递7 个教程：一键部署 MegaTTS3*Dia-1.6B：情感语音合成 Demo*FramePack 低显存视频生成 Demo*Baichuan-Audio 开源端到端语音交互基座*InstantCharacter：生成任意个性化角色行为*使用 vLLM+Open WebUI 部署 GLM-4-32B*使用 vLLM+Open WebUI 部署 Qwen3 系...
发布了文章4 月 24 日
OpenBayes 一周速览｜EasyControl 高效控制 DiT 架构，助力吉卜力风图像一键生成...
OpenBayes
公共资源速递10 个教程：一键部署 R1-OneVisionUNO：通用定制化图像生成TripoSG：单图秒变高保真 3D使用 VASP 进行机器学习力场训练InfiniteYou 高保真图像生成 DemoVenusFactory 蛋白质工程设计平台Qwen2.5-0mni 看听说写全模态打通一键部署 DeepCoder-14B-PreviewV...
发布了文章4 月 23 日
Openbayes 教程上新丨多主体驱动生成能力达SOTA，字节UNO模型可处理多种图像生成任务
 OpenBayes
如今，主体驱动生成 (subject-driven generation) 已经广泛应用于图像生成领域，但其在数据可扩展性和主体扩展性方面仍面临诸多挑战，例如从单主体数据集转向多主体并对其进行扩展尤为困难；目前的热门研究方向是单主体，在面对多主体生成任务时表现欠佳。
发布了文章4 月 16 日
OpenBayes 教程上新丨开源代码推理模型 DeepCoder-14B-Preview 狂揽 3k stars
OpenBayes
4 月 9 日凌晨，Agentica 团队携手 Together AI 联合开源了名为 DeepCoder-14B-Preview 的代码推理模型，这个仅需 14B 即可媲美 OpenAI o3-Mini 的新模型迅速引起业界广泛关注，在 GitHub 狂揽 3k stars。
发布了文章4 月 10 日
OpenBayes 一周速览｜1分钟生成完整音乐，DiffRhythm人声伴奏一键搞定
 OpenBayes
公共资源速递5 个数据集：302 例罕见病病例数据集DRfold2 RNA 结构测试数据集NaturalReasoning 自然推理数据集VenusMutHub 蛋白质突变小样本数据集Bird Vs Drone 鸟类与无人机图像分类数据集2 个模型：Qwen2.5-0mniLlama-4-Scout-17B-16E-Instruct4 个教程：CSM 双人...
发布了文章4 月 10 日
OpenBayes 教程上新丨字节开源 InfiniteYou 图像生成框架，实现高保真面部特征迁移
 OpenBayes
InfiniteYou（简称 InfU）是由字节跳动智能创作团队近期推出的一款基于 Diffusion Transformers 的身份保持 (identity-preserved) 图像生成框架。它通过先进的技术，能够在生成图像的同时保持人物身份的一致性，即在生成不同场景的图片时能够精准保留面部特征。

加载更多