根据中国互联网络信息中心(CNNIC)2017年8月4日在京发布的第40次《中国互联网络发展状况统计报告》显示,截至2017年6月,中国网民规模达到7.51亿,占总人口的54.3%;每周人均上网时间是26.5小时;96.3%的网民互联网接入设备是智能手机。而截至2016年12月,开展互联网营销的企业占总数的38.7%。这是科技发展社会进步的体现,现在人们除了每天6至8小时的睡觉时间,基本手机不离手,网民们上网少不了的是购物,比如淘宝双十一、京东618的购物节,已经不仅仅是某个电商平台的节日,而是整个零售行业的“狂欢”。那么在互联网经济迅猛发展的时代,商品信息服务和数据服务如何才能顺应潮流呢?
早在2003年,中国物品编码中心(以下简称编码中心)就通过建立中国商品信息服务平台为系统成员提供了权威的商品信息通报渠道,目前中国商品信息通报数据库已有30余万家企业,商品数据超过7500万。近几年,年度数据增长量均达到了1000多万条,但目前商品信息数据库的数据,因完整性和质量不够,无法有效精准地支撑更深层次的数据应用。
在此背景下,为了更好落实政府加强信息公开的总体要求,编码中心于2015年提出了商品源数据的概念,进一步夯实信息公开的工作。商品“源数据”战略,包括标准数据采集服务、信息共享平台、数字化产品方案和深度应用项目,通过全力建设和打造基于商品条码的高质量数据共享中心,利用2年时间建立覆盖全国的数据工作室服务网络,完成老百姓日常消费的热门产品常用信息积累。其中数据采集工作室是商品“源数据”战略的基础,负责确保商品信息采集的准确性、应用GS1标准体系实现数据标准化、解决商品信息电子化问题,有效降低商品信息采集的门槛。源数据工作室框架,如图1所示。
图1 源数据工作室详细框架
采集标准的商品图片信息
源数据工作室采集的商品图片以GS1的《产品图片规则(Product_Image_Specification v2.5)》要求为标准,以确保商品图片的高质量及全球数据池的通用性。首先,图片文件的命名规范是基于商品条码根据商品不同的面进行的,图片文件的命名规则,见图2:
图2 商品图片文件命名图示(引用自GS1产品图片规则)
•GTIN.1 正面图(必填)
•GTIN.2 左侧图
•GTIN.3 顶部图
•GTIN.7 背面图(必填)
•GTIN.8 右侧图
•GTIN.9 底部图
•GTIN.10 补充图
其次,按照源数据图片采集的要求,所采集的商品图片的背景必须为纯白色,以及图像必须清晰可辨,具体详细要求有以下十点:
1.图片为JPEG、PNG或TIF格式;
2.图片最低像素2400 × 2400;
3.宽高比1:1,分辨率300dpi;
4.图片为RGB颜色空间;
5.图像是在白色背景中(255,255,255);
6.商品图像居中,商品最长边两端与图片边界的距离占图片总长的2%-5%;
7.图像不包括道具、装饰或参考辅助对象;
8.图像中不显示商品包装喷墨信息;
9.柔和均匀照明减少反射;
10.图像清晰,数据清晰。
采集标准的商品属性信息
源数据采集工作系统的商品属性采用国际标准,结合国内商品包装的实际印刷情况,进行了标准化转换和优化,为未来开放性应用做基础准备。从整体来看,源数据采集工作系统的属性分为基础属性和特征属性。根据国际国内标准的转化和优化,基础属性包括企业信息、商品分类、净含量和商品描述等共29项,其中必填项18项,选填项9项,系统自动匹配生成2项;目前源数据采集工作系统涵盖了食品饮料、保健食品、酒类、箱包、洗化用品、烟草、药品、餐具、鞋类和种子等共10个类别的商品,涉及的总特征属性88项,必填项54项。不同类别商品的关键特征属性及其必填项各不相同,是根据商品的类别及其对应的标准总结优化出来的,如食品饮料类的特征属性中的成分、口味、添加剂、营养成分和过敏原是该类商品必填的特征属性项;烟草类商品属性中的卷烟数量、焦油量、烟气烟碱量、烟气一氧化碳量和包装形式是该类商品必填的特征属性项;酒类商品属性中的酒精度和酒品分类为该类商品的必填特征属性项;剩下的其它7个类别的商品均有其特定的必填属性项,此处不再一一列举。
商品“源数据”战略实施对标准化商品信息服务的重要意义
为了让消费者详尽地了解商品,商品展示的信息应该包括多方面的内容(如表1),在实施“源数据”战略过程中,就涉及到源数据采集过程中应该收集哪些商品属性以及所收集的属性如何管理的问题。由于“源数据”战略的出发点是通过向生产方、流通方、销售方、购物方提供标准化商品信息数据服务,协助贸易各方进行信息交互,即要求所采集商品源数据信息今后能实现跨平台跨领域应用。围绕表1所示商品信息,按照《GS1通用规范》《GDSN产品包装测量规范》《GDSN 3.1 Trade Item Implementation Guide》《BMS GDSN Trade Item Module Library》等国际规范和《商品条码管理办法》、GB/T 12904-2008 《商品条码 零售商品编码与条码表示》、GB/T 16830-2008《商品条码 储运包装商品编码与条码表示》、GB/T 18127-2009 《商品条码 物流单元编码与条码表示》等国家标准和规范的要求,源数据工作室便生成一份标准化的商品信息数据。
表1 商品数据信息表
由于源数据采集工作室所采集的商品信息数据是遵循国际国内一系列相关标准和规范的,所以源数据的商品信息数据是标准化的、开放通用的数据,这一份数据信息不但可以同步到传统零售领域,还可以同步到电商平台、搜索引擎以及移动应用领域,真正实现一份标准化的数据信息能够提供给多个合作伙伴和应用于多个领域,更好满足未来的应用要求。这就是 “源数据”战略采集的标准化数据的实际意义与价值。
中国物品编码中心广西分中心 林翠霞
《条码与信息系统》2018年第2期总第144期