注册登录
产品
社群
使用“Bing”搜本站
使用“Google”搜本站
使用“百度”搜本站
✓
站内搜索
注册登录
问答
博客
资讯
标签
用户
活动
极客观点
项目管理
HarmonyOS
开发者社区
热门标签
javascript
前端
python
node.js
react
vue.js
php
laravel
go
人工智能
mysql
linux
ios
java
android
css
typescript
spring
程序员
ONES 研发管理
思否企业问答
安谋科技 XPU
问答
博客
资讯
标签
用户
活动
极客观点
项目管理
HarmonyOS
开发者社区
热门标签
javascript
前端
python
node.js
react
vue.js
php
laravel
go
人工智能
mysql
linux
ios
java
android
css
typescript
spring
程序员
ONES 研发管理
思否企业问答
安谋科技 XPU
deephub
54
获赞数
4
关注数
115
粉丝数
关注他
发私信
北京
www.overfit.cn
IP 属地北京
2020-03-13 加入
浏览 48.7k
举报
屏蔽
主页
回答
提问
文章
1252
更多
更多机器学习和人工智能文章,请关注同名公众号 deephub-IMBA
125 声望
|
学徒
人工智能
104
深度学习
85
神经网络
78
机器学习
70
pytorch
35
1
黄金勋章
百日斩
6
白银勋章
痴迷者
狂热博主
398
青铜勋章
长文达人
博客新秀
支持者
个人动态
发布了文章
今天 10:37
Python 3.14七大新特性总结:从t-string模板到GIL并发优化
deephub
Python 3.14已进入测试阶段,根据PEP 745发布计划,该版本已停止引入新功能,也就是说新特征就应该已经固定下来了。所以本文基于当前最新的beta 2版本,深入分析了Python 3.14中的七项核心新特性。
发布了文章
7 月 5 日
量化交易隐藏模式识别方法:用潜在高斯混合模型识别交易机会
deephub
在SPY股票数据分析过程中,虽然能够有效识别日线价格趋势,但挖掘数据中的潜在模式仍然面临重大挑战。市场数据普遍存在高噪声特征,传统分析工具难以识别稳定的行为模式。移动平均线等常规技术指标虽然能够平滑数据,但往往掩盖了数据的内在结构信息。潜在高斯混合模...
发布了文章
7 月 4 日
掌握这10个Jupyter魔法命令,让你的数据分析效率提升3倍
deephub
作为数据科学从业者,我们经常需要在 Jupyter 笔记本环境中进行数据处理、模型构建和结果可视化等工作。然而,许多开发者并未充分利用 Jupyter 笔记本的内置功能——魔法命令(Magic Commands)。
发布了文章
7 月 3 日
大语言模型也可以进行图像分割:使用Gemini实现工业异物检测完整代码示例
deephub
Gemini模型在大语言模型市场中展现出独特的优势,特别是在计算机视觉领域具有显著的技术潜力。与其他主流大语言模型相比,Gemini在目标检测和图像分割方面具备原生支持能力。较大规模的Gemini模型经过专门训练,能够直接输出边界框坐标和分割掩码,这一特性在当前的...
发布了文章
7 月 2 日
CUDA性能优化实战:7个步骤让并行归约算法提升10倍效率
deephub
本文深入探讨了一个经典的并行计算算法——并行归约(Parallel Reduction)的性能优化过程,通过七个渐进式的优化步骤,展示了如何将算法性能提升至极致。这项研究基于Mark Harris在NVIDIA网络研讨会中提出的优化方法,在重现这些优化技术的同时,进一步简化了概念阐述...
发布了文章
7 月 1 日
Python时间序列平滑技术完全指南:6种主流方法原理与实战应用
deephub
在时间序列数据分析中,噪声问题是不可避免的挑战。即使在信号质量良好的情况下,原始数据仍可能包含各种干扰因素。这些噪声可能来源于传感器硬件缺陷、人工测量过程中的随机误差,或者数据本身固有的统计波动特性,这些因素都会对有效趋势信息的提取造成显著影响。
发布了文章
6 月 30 日
Python AutoML框架选型攻略:7个工具性能对比与应用指南
deephub
机器学习模型的构建过程历来需要大量的手动调参工作,包括超参数优化、算法选择和特征工程等环节,往往需要数周的时间投入。尽管这种传统的开发模式仍然存在,但AutoML技术的发展已经显著简化了这一过程。
发布了文章
6 月 29 日
大数据集特征工程实践:将54万样本预测误差降低68%的技术路径与代码实现详解
deephub
特征工程作为机器学习流程中的关键环节,在模型训练之前执行,其质量直接影响模型性能。虽然深度学习模型在图像和文本等非结构化数据的特征自动学习方面表现优异,但对于表格数据集而言,显式特征工程仍然是不可替代的核心技术。本文通过实际案例演示特征工程在回归...
发布了文章
6 月 28 日
Arctic长序列训练技术:百万级Token序列的可扩展高效训练方法
deephub
在现实应用场景中,许多AI系统需要处理超过数十万token的长文本序列,例如密集文档分析、长对话理解以及检索增强生成(RAG)管道等。当前大多数语言模型仅在相对较短的文本片段上进行训练。这种训练与应用需求的不匹配,类似于要求模型仅通过阅读小说的一页内容就能完...
发布了文章
6 月 27 日
小模型当老师效果更好:借助RLTs方法7B参数击败671B,训练成本暴降99%
deephub
Sakana AI提出的强化学习教师模型(Reinforcement-Learned Teachers, RLTs)代表了一种全新的训练范式。该方法颠覆了传统强化学习需要模型从零开始通过稀疏奖励信号解决问题的训练方式,转而从已知答案出发,训练小型"教师"模型以适合学生模型学习的方式解释解决方案。
发布了文章
6 月 26 日
基于Dyna-Q强化学习的智能营销系统:融合贝叶斯生存模型与Transformer注意力机制的电商客户重参与策略优化
deephub
本文提出了一个集成三种核心技术的下一代智能优惠券分发系统:基于贝叶斯生存模型的重购概率预测、采用注意力机制的Transformer利润预测模型,以及用于策略持续优化的Dyna-Q强化学习代理。该系统构建了一个自优化的闭环架构,通过贝叶斯生存分析筛选高价值客户,利用...
发布了文章
6 月 25 日
解决语义搜索痛点,基于对比学习的领域特定文本嵌入模型微调实践
deephub
文本嵌入模型能够将文本转换为具有语义意义的向量表示,广泛应用于检索、分类等多种任务场景。然而,通用嵌入模型在处理特定领域任务时往往存在性能瓶颈。微调技术为解决这一问题提供了有效途径。本文将深入探讨嵌入模型微调的核心原理,并以AI职位匹配为例,详细阐...
发布了文章
6 月 24 日
基于LSTM自编码器与KMeans聚类的时间序列无监督异常检测方法
deephub
时间序列异常检测是金融监控、网络安全防护、工业制造控制以及物联网系统监测等领域的核心技术问题。本文研究了一种结合深度学习LSTM自编码器与KMeans聚类算法的无监督异常检测方法,该方法首先利用LSTM自编码器学习序列数据的潜在表示,然后在潜在空间中应用KMeans...
发布了文章
6 月 23 日
混合效应模型原理与实现:从理论到代码的完整解析
deephub
考虑这样一个实际场景:在构建用于预测200家医院患者住院时长的模型时,尽管梯度提升模型在测试集上表现优异,但深入分析会发现一个系统性问题:医院A的住院时长始终高于模型预测值,而医院B则总是低于预测值。传统模型对所有医院采用相同的预测策略,忽略了各医院间...
发布了文章
6 月 22 日
Chonkie:面向大语言模型的轻量级文本分块处理库
deephub
Chonkie是一个专为大语言模型(LLM)应用场景设计的轻量级文本分块处理库,提供高效的文本分割和管理解决方案。该库采用最小依赖设计理念,特别适用于现实世界的自然语言处理管道。本文将详细介绍Chonkie的核心功能、设计理念以及五种主要的文本分块策略。
发布了文章
6 月 21 日
机器学习异常检测实战:用Isolation Forest快速构建无标签异常检测系统
deephub
无监督异常检测作为机器学习领域的重要分支,专门用于在缺乏标记数据的环境中识别异常事件。本文深入探讨异常检测技术的理论基础与实践应用,通过Isolation Forest算法进行异常检测,并结合LightGBM作为主分类器,构建完整的欺诈检测系统。文章详细阐述了从无监督异...
发布了文章
6 月 20 日
从零复现Google Veo 3:从数据预处理到视频生成的完整Python代码实现指南
deephub
Google Veo 3作为当前最先进的文本到视频生成系统,能够根据文本提示生成高质量、高分辨率的视频内容并同步生成音频。该系统在性能上已超越OpenAI SORA等同类模型,代表了视频生成领域的最新技术水平。
发布了文章
6 月 19 日
Python构建MCP服务器完整教程:5步打造专属AI工具调用系统
deephub
模型控制协议(Model Control Protocol, MCP)是一种专为实现AI代理与工具解耦而设计的通信协议,为AI驱动应用程序的开发提供了高度的灵活性和模块化架构。通过MCP服务器,AI代理能够动态发现并调用各种工具来响应用户请求。本文将详细介绍MCP服务器的构建过程,包括...
发布了文章
6 月 18 日
Adaptive-k 检索:RAG 系统中自适应上下文长度选择的新方法
deephub
本文介绍 Adaptive-k 检索技术,这是一种通过相似性分布分析动态确定最优上下文规模的即插即用方法,该技术在显著降低 token 消耗的同时实现了检索增强生成系统的性能提升。
发布了文章
6 月 17 日
基于时间图神经网络多的产品需求预测:跨序列依赖性建模实战指南
deephub
本文从理论基础出发深入探讨图神经网络(Graph Neural Networks, GNNs)及以供应链需求预测为应用场景在多产品日销售量预测中的应用。在相关SKU构成的复杂网络中,单一产品的销售波动往往会对其他产品产生连锁影响。本文展示了如何通过学习稀疏影响图、应用图卷积融...
标签得分
暂无数据
获得勋章
暂无数据
声望记录
暂无数据