发布了文章6 月 24 日
前言本文对 Elasticsearch 7.17 适用假定有个 ip 类型的字段 client_ip,需要根据字段值的个数过滤数据在 query 中使用 script 只能通过 doc['client_ip'] 获取到去重后的个数研究发现使用 runtime_mappings 可以动态新建字段获取到不去重的个数示例创建索引 {代码.....
发布了文章6 月 20 日
前言技术栈 {代码...} 示例代码 {代码...} 本文出自 qbit snap
发布了文章6 月 16 日
Elasticsearch 有 wildcard 数据类型和 wildcard 匹配方式,两者不要混淆Elasticsearch 的 wildcard 数据类型 在 7.9 版本引入wildcard 数据类型 主要用于缓解 keyword 模糊匹配(*foo)效率低下的问题在 wildcard 数据类型 出现之前,开发者通常用 ngram 分词来处理...
赞了文章6 月 10 日
要对具有数字字段的查询使用距离评分,用户必须为每个字段定义原点和比例。需要原点来定义计算距离的中心点,需要尺度来定义衰减速率。将衰减函数指定为
发布了文章4 月 21 日
前言技术栈 {代码...} uvicorn 默认日志没有时间戳,看起来不方便,主动配置日志格式,使得 uvicorn 打印的日志格式和 loguru 的默认格式一致 {代码...} uvicorn 日志配置文件内容uvicorn_log_config.json {代码...} 参考文献uvicorn 配置文件官方文档: [链接]本文...
发布了文章3 月 13 日
前言技术栈 {代码...} 截至 2025.3.13,nls.NlsSpeechTranscriber 不支持异步调用使用 asyncio.run 或 loop.create_task 将异步调用转化为同步调用后文中,为保持字节流和字符串的一致性,定义了不同格式的结束符 {代码...} 材料准备从 GitHub 下载 nls 目录和 tests...
发布了文章3 月 9 日
而 OBB 是 Opaque Binary Blob 的缩写,它通常用于存储大型应用程序的额外数据或资源,比如游戏中的图形资源、音频文件等。
发布了文章3 月 5 日
Chatbot Arena 是一个由加州大学伯克利分校 SkyLab 和 LMSYS 的研究人员开发的开源平台,用于通过人类偏好评估人工智能。这个榜单是人类盲测的,Lecun,Karpathy,Ilya等大神和Altman等人都认可这个榜单。
发布了文章2 月 5 日
前言技术栈 {代码...} 测试案例测试代码 {代码...} 测试输出 {代码...} 相关阅读pyparsing.Regex 官方文档使用 pyparsing 和 sympy 化简或非逻辑表达式本文出自 qbit snap
发布了文章2 月 5 日
前言技术栈 {代码...} 案例测试代码 {代码...} 测试输出 {代码...} 相关阅读用 pyparsing 3.x 化简括号冗余的或非逻辑表达式本文出自 qbit snap
发布了文章1 月 15 日
前言软件版本 {代码...} Docker Github 仓库: [链接]容器内 SHELL进入容器内 shell {代码...} 容器的拉取、查看、运行、重启搜索容器(nginx) {代码...} 新拉一个容器(nginx) {代码...} 查看本地镜像 {代码...} 运行容器 {代码...} 查看容器 {代码...} 重启容器 ...
发布了文章1 月 13 日
前言有些历史目录并没有保留回退的必要,反而占了很多的资源,需要清理搜到到两个主流工具:BFG Repo-Cleaner 和 git filter-repogit filter-repo 被 git 官方推荐,下文用 git filter-repo 举例安装 git filter-repo {代码...} 查找大文件查找大文件,包括已删除的...
发布了文章2024-12-30
前言记录 wireshark 使用案例查看 github 访问情况技术栈 {代码...} 本地 proxy 软件为 vTray {代码...} wireshark 监听 loopback,不是 以太网 或 本地连接wireshark 捕获过滤器规则 {代码...} 使用 http 代理curl 访问 github {代码...} wireshark 显示过滤器规则 ...
发布了文章2024-12-27
qbit 在使用 Python 的 FastAPI 框架,在 Python 脚本中用 os.system 调用了 uvicorn 启动程序,调用链条大致如下
发布了文章2024-12-23
前言本文对 Elasticsearch 7.17 适用,官方文档 Token count field type测试新建 mapping {代码...} 写入测试数据 {代码...} 查询 {代码...} 查询结果如下 {代码...} 案例Elasticsearch 分词匹配能否完整匹配查询 token?有且只有查询 token 的被召回。数据如下 {代...
发布了文章2024-12-19
前言本文对 ES 7.17 适用需要探讨的问题 {代码...} {代码...} 以下测试均使用 ES 内置的 simple 分词器试验过程直接查看分词结果 {代码...} 可以看到分词结果 position {代码...} 新建索引并写入数据创建 my_index 索引 {代码...} 写入数据 {代码...} 查看数据 {代码...
发布了文章2024-12-12
前言本文在 Elasticsearch 7.17 下测试Elasticsearch 自 7.10 引入了 64 位无符号整数 unsigned_long,之前只有 long已知 long 的数据范围 {代码...} 已知 unsigned_long 的数据范围 {代码...} 试验创建索引 {代码...} 测试 LLL 字段,写入数据 18446744073709551615...
发布了文章2024-11-26
前言记录常用的 http 压测工具JmeterGitHub 地址 [链接]Apache 老牌压测工具,图形界面版ab官方地址 [链接]Apache HTTP 服务器自带的一个性能测试工具,命令行工具heyGitHub 地址 [链接]一个由 Google 工程师 Martin Heinz(rakyll)使用 Go 语言开发的HTTP压力测试...
发布了文章2024-11-21
技术栈 {代码...} 启动 gradio 报如下信息 {代码...} 经排查,是因为 gradio 时调用 系统 where 命令去找 nodejs {代码...} 本文出自 qbit snap
发布了文章2024-11-21
前言技术栈 {代码...} Gradio 格式化 json示例代码 {代码...} 格式化前截图格式化后截图Streamlit 格式化 json示例代码 {代码...} 示例截图截至 Streamlit 1.40.1,Streamlit 似乎无法复用数据框输出内容相关阅读Gradio 官方文档:[链接]Streamlit 官方文档:[链接]...