一、功能介绍
对于输入的一张车载监控图片(可正常解码,且长宽比适宜),识别图像中是否有人体(驾驶员),若检测到至少1个人体,则进一步识别属性行为,可识别使用手机、抽烟、未系安全带、双手离开方向盘、视线未朝前方5种典型行为姿态。
图片质量要求:
1、服务只适用于车载司机场景,请使用驾驶室的真实监控图片测试,勿用网图、非车载场景的普通监控图片、或者乘客的监控图片测试,否则效果不具备代表性。
2、车内摄像头硬件选型无特殊要求,分辨率建议720p以上,但更低分辨率的图片也能识别,只是效果可能有差异。
3、车内摄像头部署方案建议:尽可能拍全驾驶员的身体,并充分考虑背光、角度、方向盘遮挡等因素。
4、服务适用于夜间红外监控图片,识别效果跟可见光图片相比可能略微有差异。
5、图片主体内容清晰可见,模糊、驾驶员遮挡严重、光线暗等情况下,识别效果肯定不理想。
具体功能说明,请参考官方说明文档(驾驶行为分析):https://ai.baidu.com/docs#/Body-API/fd34bf01
二、应用场景
1、营运车辆驾驶监测
针对出租车、客车、公交车、货车等各类营运车辆,实时监控车内情况,识别驾驶员抽烟、使用手机、未系安全带等危险行为,及时预警,降低事故发生率,保障人身财产安全。
2、社交内容分析审核
汽车类论坛、社区平台,对配图库以及用户上传的UGC图片进行分析识别,自动过滤出涉及危险驾驶行为的不良图片,有效减少人力成本并降低业务违规风险。
三、使用攻略
说明:本文采用C# 语言,开发环境为.Net Core 2.1,采用在线API接口方式实现。
(1)、登陆 百度智能云-管理中心 创建 “人体分析”应用,获取 “API Key ”和 “Secret Key”:https://console.bce.baidu.com/ai/?_=1566223151105&fromai=1#/ai/body/overview/index
(2)、根据 API Key 和 Secret Key 获取 AccessToken。
///
/// 获取百度access_token
///
/// API Key
/// Secret Key
///
public static string GetAccessToken(string clientId, string clientSecret)
{
string authHost = "https://aip.baidubce.com/oauth/2.0/token";
HttpClient client = new HttpClient();
List> paraList = new List>();
paraList.Add(new KeyValuePair("grant_type", "client_credentials"));
paraList.Add(new KeyValuePair("client_id", clientId));
paraList.Add(new KeyValuePair("client_secret", clientSecret));
HttpResponseMessage response = client.PostAsync(authHost, new FormUrlEncodedContent(paraList)).Result;
string result = response.Content.ReadAsStringAsync().Result;
JObject jo = (JObject)JsonConvert.DeserializeObject(result);
string token = jo["access_token"].ToString();
return token;
}
(3)、调用API接口获取识别结果
1、在Startup.cs 文件 的 Configure(IApplicationBuilder app, IHostingEnvironment env) 方法中开启虚拟目录映射功能:
string webRootPath = HostingEnvironment.WebRootPath;//wwwroot目录
app.UseStaticFiles(new StaticFileOptions
{
FileProvider = new PhysicalFileProvider(
Path.Combine(webRootPath, "Uploads", "BaiduAIs")),
RequestPath = "/BaiduAIs"
});
2、 建立BodySearch.cshtml文件
2.1前端页面说明
由于html代码无法原生显示,只能简单说明一下:
主要是一个form表单,需要设置属性enctype="multipart/form-data",否则无法上传图片;
form表单里面有两个控件:
一个Input:type="file",asp-for="FileUpload" ,上传图片用;
一个Input:type="submit",asp-page-handler="DriverBehavior" ,提交并返回识别结果。
一个img:src="@Model.curPath",显示识别的图片。
最后显示后台 msg 字符串列表信息。
2.2 后台代码
[BindProperty]
public IFormFile FileUpload { get; set; }
private readonly IHostingEnvironment HostingEnvironment;
public List msg = new List();
public string curPath { get; set; }
public BodySearchModel(IHostingEnvironment hostingEnvironment)
{
HostingEnvironment = hostingEnvironment;
}
public async Task OnPostDriverBehaviorAsync()
{
if (FileUpload is null)
{
ModelState.AddModelError(string.Empty, "请先选择本地图片!");
}
if (!ModelState.IsValid)
{
return Page();
}
msg = new List();
string webRootPath = HostingEnvironment.WebRootPath;//wwwroot目录
string fileDir = Path.Combine(webRootPath, "Uploads//BaiduAIs//");
string imgName = await UploadFile(FileUpload, fileDir);
string fileName = Path.Combine(fileDir, imgName);
string imgBase64 = GetFileBase64(fileName);
curPath = Path.Combine("/BaiduAIs/", imgName);//需在Startup.cs 文件 的 Configure(IApplicationBuilder app, IHostingEnvironment env)方法中开启虚拟目录映射功能
string result = GetBodyeJson(imgBase64, “你的API KEY”, “你的SECRET KEY”);
JObject jo = (JObject)JsonConvert.DeserializeObject(result);
List msgList = jo["person_info"].ToList();
int number = int.Parse(jo["person_num"].ToString());
int curNumber = 1;
float score = 0;
float threshold = 0;
msg.Add("人数:" + number + "");
foreach (JToken ms in msgList)
{
if (number > 1)
{
msg.Add("第 " + (curNumber++).ToString() + " 人:");
}
score = float.Parse(ms["attributes"]["smoke"]["score"].ToString());
threshold = float.Parse(ms["attributes"]["smoke"]["threshold"].ToString());
msg.Add("吸烟:" + (score > threshold ? "大概率" : "小概率"));
msg.Add("概率:" + score.ToString());
msg.Add("阈值:" + threshold.ToString());
score = float.Parse(ms["attributes"]["cellphone"]["score"].ToString());
threshold = float.Parse(ms["attributes"]["cellphone"]["threshold"].ToString());
msg.Add("使用手机:" + (score > threshold ? "大概率" : "小概率"));
msg.Add("概率:" + score.ToString());
msg.Add("阈值:" + threshold.ToString());
score = float.Parse(ms["attributes"]["not_buckling_up"]["score"].ToString());
threshold = float.Parse(ms["attributes"]["not_buckling_up"]["threshold"].ToString());
msg.Add("未系安全带:" + (score > threshold ? "大概率" : "小概率"));
msg.Add("概率:" + score.ToString());
msg.Add("阈值:" + threshold.ToString());
score = float.Parse(ms["attributes"]["both_hands_leaving_wheel"]["score"].ToString());
threshold = float.Parse(ms["attributes"]["both_hands_leaving_wheel"]["threshold"].ToString());
msg.Add("双手离开方向盘:" + (score > threshold ? "大概率" : "小概率"));
msg.Add("概率:" + score.ToString());
msg.Add("阈值:" + threshold.ToString());
score = float.Parse(ms["attributes"]["not_facing_front"]["score"].ToString());
threshold = float.Parse(ms["attributes"]["not_facing_front"]["threshold"].ToString());
msg.Add("视角未朝前方:" + (score > threshold ? "大概率" : "小概率"));
msg.Add("概率:" + score.ToString());
msg.Add("阈值:" + threshold.ToString());
}
return Page();
}
///
/// 上传文件,返回文件名
///
/// 文件上传控件
/// 文件绝对路径
///
public static async Task UploadFile(IFormFile formFile, string fileDir)
{
if (!Directory.Exists(fileDir))
{
Directory.CreateDirectory(fileDir);
}
string extension = Path.GetExtension(formFile.FileName);
string imgName = Guid.NewGuid().ToString("N") + extension;
var filePath = Path.Combine(fileDir, imgName);
using (var fileStream = new FileStream(filePath, FileMode.Create, FileAccess.Write))
{
await formFile.CopyToAsync(fileStream);
}
return imgName;
}
///
/// 返回图片的base64编码
///
/// 文件绝对路径名称
///
public static String GetFileBase64(string fileName)
{
FileStream filestream = new FileStream(fileName,FileMode.Open);
byte[] arr = new byte[filestream.Length];
filestream.Read(arr, 0, (int)filestream.Length);
string baser64 = Convert.ToBase64String(arr);
filestream.Close();
return baser64;
}
///
/// 人体检测Json字符串
///
/// 图片base64编码
/// API Key
/// Secret Key
///
public static string GetBodyeJson(string strbaser64, string clientId, string clientSecret)
{
string token = GetAccessToken(clientId, clientSecret);
string host = "https://aip.baidubce.com/rest/2.0/image-classify/v1/driver_behavior?access_token=" + token;
Encoding encoding = Encoding.Default;
HttpWebRequest request = (HttpWebRequest)WebRequest.Create(host);
request.Method = "post";
request.KeepAlive = true;
string str = "image=" + HttpUtility.UrlEncode(strbaser64);
byte[] buffer = encoding.GetBytes(str);
request.ContentLength = buffer.Length;
request.GetRequestStream().Write(buffer, 0, buffer.Length);
HttpWebResponse response = (HttpWebResponse)request.GetResponse();
StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.Default);
string result = reader.ReadToEnd();
return result;
}
四、效果测试
1、页面:
2、识别结果:
2.1
2.2
2.3
2.4
2.5
四、测试结果及建议
从上图中测试结果可知,百度的驾驶行为分析整体识别效果还是不错的,可以比较准确的识别使用手机、抽烟、未系安全带、双手离开方向盘、视线未朝前方5种典型行为姿态。另外,可以根据不同的驾驶场景/要求,设定不同的阈值,从而达到不同的识别要求。
可以结合【百度语音】技术,采取语音提醒等预警方式,提醒正在驾驶的司机注意自己的不好的驾驶行为,及时预警,可以有效降低事故发生率,保证生命财产安全。
可以结合【人体检测和属性识别】技术,识别车内的人员数量,根据设定的阈值判断车辆是否超载,并根据超载严重程序进行不同的预警。
如若能够识别司机是否疲劳驾驶、是否处于情绪不稳定的状态,并给出相应的预警提醒就更好了。
不过,个人觉得,最关键的,是需要将危险行驶行为识别跟交警部门进行数据互通,及时上传司机的危险驾驶行为,并根据司机危险形式行为的严重程度,做出相应的惩罚,这样才能真正有效减少事故发生率,因为其实司机能够考取驾驶证,说明他/她心里是十分清楚自己的行为是否是危险驾驶行为,但是抱着侥幸心理,所以才会做出危险驾驶行为的,渐渐的让危险驾驶行为变成了一种常态,单纯的预警实际效果是比较差的。