需要开启 OpenTelemetry 的 SkyWalking 数据接收能力,将数据经过 OpenTelemetry 标准协议处理之后,发送到 DeepFlow Agent。
OpenTelemetry 接收 SkyWalking 数据存在 Bug,最近我们在 #11562 (opens new window)与 #12651 (opens new window)这两个 PR 中进行了修复,接下来的 Demo 我们需要 OpenTelemetry 的 Collector 镜像 (opens new window)版本 >= 0.57.0
。请检查你的环境中 otel-agent 的镜像版本,并确保它符合要求。可参考前序章节中的 OpenTelemetry 安装,更新你的环境中的 otel-agent 版本。
使用如下命令可在 K8s 中快速部署 已配置好skywalking的Demo
kubectl apply -f https://raw.githubusercontent.com/deepflowio/deepflow-demo/main/DeepFlow-Otel-SkyWalking-Demo/deepflow-otel-skywalking-demo.yaml
关闭自动访问服务,选择手动触发
kubectl delete deployment loadgenerator -n deepflow-otel-skywalking-demo
kubectl get svc -A | grep skywalking
查看deepflow-otel-skywalking-demo的web-shop容器ip与端口
配置nginx域名访问
server {
listen 80;
server_name ecs-skywalking-spring;
location / {
proxy_pass http://10.96.0.2:8090;
proxy_set_header Host $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
}
}
浏览器输入http://ecs-skywalking-spring/shop#
,访问demo页面,点击页面上最右边的Full TestCase按钮执行测试。前往 Grafana,打开 Distributed Tracing Dashboard
,选择 request_resource = /shop/full-test
后,可选择一个调用进行追踪。
DeepFlow 的追踪数据中含有三种 Span,跟踪一次请求的整个轨迹:
- N:通过 BPF 从网络流量中提取的 Span
- S:通过 eBPF 从系统或应用函数调用中提取的 Span
- A:通过 OTel 从应用内部采集的 Span
上图中展示了前两种,接下来配置SkyWalking展示第三种。
安装 otel-agent
kubectl apply -n open-telemetry -f https://raw.githubusercontent.com/deepflowio/deepflow-demo/main/open-telemetry/open-telemetry.yaml
使用如下命令修改 otel-agent 配置
kubectl -n open-telemetry edit cm otel-agent-conf
在 receivers 一节中,增加如下内容
receivers:
# add the following config
skywalking:
protocols:
grpc:
endpoint: 0.0.0.0:11800
http:
endpoint: 0.0.0.0:12800
在 service.pipelines.traces 一节中,增加如下内容
service:
pipelines:
traces:
# add receiver `skywalking`
receivers: [skywalking]
使用如下命令修改 otel-agent Service,开放对应端口
kubectl -n open-telemetry patch service otel-agent -p '{"spec":{"ports":[{"name":"sw-http","port":12800,"protocol":"TCP","targetPort":12800},{"name":"sw-grpc","port":11800,"protocol":"TCP","targetPort":11800}]}}'
然后,检查应用中配置的 SkyWalking OAP Server (opens new window)的对接地址,并修改为 Otel Agent 的 Service 地址:otel-agent.open-telemetry
,比如将环境变量 SW_AGENT_COLLECTOR_BACKEND_SERVICES=oap-server:11800
修改为 SW_AGENT_COLLECTOR_BACKEND_SERVICES=otel-agent.open-telemetry:11800
。当然,应用配置的上报地址可能有各种形式,请根据应用实际启动命令修改,对于 Java 应用而言,只需要确保能修改启动命令中注入的地址即可,如:-Dskywalking.collector.backend_service=otel-agent.open-telemetry:11800。这里使用的官方提供的镜像已经配置好了。
重启 otel-agent 完成 otel-agent 更新,如果配置修改有误导,pod可能会一直cash
kubectl rollout restart -n open-telemetry daemonset/otel-agent
使用./deepflow-ctl agent-group list
查看default
组的id
创建一个default-agent-group-config.yaml
文件,并添加开启 deepflow-agent 的数据接收服所需的配置
cat << EOF > default-agent-group-config.yaml
vtap_group_id: g-c26c6edc90 #这里要改成你的default组id
external_agent_http_proxy_enabled: 1 # required
external_agent_http_proxy_port: 38086 # optional, default 38086
EOF
使用如下命令基于 default-agent-group-config.yaml
文件新建配置:
./deepflow-ctl agent-group-config create -f default-agent-group-config.yaml
点击demo页面的Full TestCase按钮,在grafana页面选择其中一个调用进行跟踪,查看其火焰图
火焰图中增加了"A:通过 OTel 从应用内部采集的 Span"数据。
可参考官网理解对跟踪数据的解析。