栏目名称

联系我们

地 址:山东省潍坊市经济开发区
Q Q:54512639688
邮 箱:fenghuang88@126.com
网 址:凤凰娱乐
网上赌球网站当前位置:主页 > 网上赌球网站 >

京东商城基于机器学习的商品数据优化与知识抽

时间:2017-10-23 07:37 作者:admin 点击:

京东通过机器学习训练的商品自动分类,在多个试点一级类目实现分类准确率99%,修正上千万SKU类目错绑属性

双十一购物狂欢节马上就要到来了,各大电商平台都相继开始了预售活动大家在剁手买买买的同时,有没有发现现在的购物平台似乎更懂你了,购物体验也更加友好了这其中就有机器学习的功劳

▲京东商城基础架构部首席架构师 何小锋

2017年10月19日-21日,由IT168主办的第九届系统架构师大会邀请了京东商城基础架构部首席架构师何小锋,为我们分享一下京东商品基于机器学习的优化何小锋表示京东现在的商品数据有几十亿,商品数据录入难以有效监管,质量参差不齐,用户反馈数据也没有得到有效使用

为了更加有效的利用数据,京东不仅要对商家录入的数据进行清洗,而且要为商家提供算法,从源头把控数据质量据何小锋介绍目前京东主要在商品标题合规、商品类目清洗、商品属性间不一致检测、自营价格合规、问答与评论SPAM检测、用户评论知识抽取等方面做了工作

1. 商品标题合规

如果大家有过网购经验,那么就一定会有这样的经历,搜索到的商品标题太长,堆砌了太多词汇,导致页面显示不全为了让商品标题合规,更易于消费者阅读,京东首先会对超长的标题进行分词,然后对命名实体进行识别,并进行短文本理解,最后重组标题

2. 商品类目清洗

京东商品类目面临的困难是类目错绑情况严重,商品录入量大,难以管控,有些大型店铺sku可达数十万条;商品类目数多,精准录入难,三级分类就近4000条;主观理解商品类目划分错误:部分商品类目有重叠,难界定

3. 商品属性间不一致校验