1. 快速定位TDengine服务启动失败的日志文件
当taosd服务启动失败时,第一反应应该是查看日志。TDengine默认将日志存放在/var/log/taos/目录下,最新的日志文件通常是taosdlog.0。这里有个实用技巧:通过文件修改时间快速确认当前活跃的日志文件:
ls -lt /var/log/taos/ | head -n 3
查看ERROR级别日志最有效的方式是使用grep过滤。我习惯用这个组合命令,能同时显示错误上下文:
grep -A 5 -B 2 'ERROR\|FATAL' /var/log/taos/taosdlog.0
注意:如果日志文件较大,建议先用
tail -n 1000限制范围。遇到过几次因为日志文件太大导致grep卡死的情况。
2. 配置文件错误导致启动失败的排查
2.1 FQDN配置问题
FQDN(全限定域名)配置错误是最常见的启动失败原因。上周我就遇到一个典型案例:用户将fqdn配置为"localhost",导致集群节点间无法通信。正确的FQDN应该满足:
- 必须是能ping通的域名
- 在/etc/hosts中有对应记录
- 不能使用保留名称如localhost
验证FQDN是否正确的完整流程:
# 查看当前配置
grep 'fqdn' /etc/taos/taos.cfg
# 测试域名解析
ping <your_fqdn>
# 检查hosts文件
cat /etc/hosts | grep <your_fqdn>
2.2 端口冲突问题
当

4171

被折叠的 条评论
为什么被折叠?



