Skip to content

欢迎各位开发者参加RP2K的打榜活动 #1

@thomas-yanxin

Description

@thomas-yanxin

欢迎各位开发者参加RP2K的打榜活动

RP2K数据集介绍

RP2K数据集收录了50万+张零售商品货架图片,商品种类超过2,000种,是目前零售类数据集中产品种类数量最多的数据集。不同于一般聚焦新产品的数据集,RP2K收录了超过50万张零售商品货架图片,商品种类超过2000种,该数据集是目前零售类数据集中产品种类数量TOP1,同时所有图片均来自于真实场景下的人工采集,针对每种商品,品览提供了十分详细的标注。RP2K致力于帮助物品识别领域进行学术研究,同时为AI物品识别从业者打造真实行业级试炼场。

商品识别的难点

在真实场景中,准确识别货架上零售产品仍然具有很高的挑战性。

  1. 同一生产线中的产品可能具有不同的尺寸,并且它们通常外观高度相似但价格不同。图像尺寸无法反映产品的实际尺寸。
  2. 制造商通常会为一条产品线制造多种口味,但是它们的外观在标签上只有非常细微的差别。
  3. 执行人员在拍摄货架图片时,由于相机角度、拍摄环境不同,图片会产生变形,图像也可能被拉伸,甚至会出现曝光不足的现象。 从下面的样例图可以看到,RP2K针对以上可能的情况均有涉及,采用细粒度识别对商品进行甄别。

RP2K数据集亮点

  1. 就产品类别而言,毫无疑问,它是迄今为止全球规模最大的零售数据集,超过2000种SKU。
  2. 所有图像均在自然采光的实体零售店中手动采集,与实际应用场景匹配度极高,具有极佳的实践落地适应性。
  3. 品览为每种商品提供了丰富的注释,包括大小、形状和味道/气味。期待RP2K数据集可以为计算机视觉领域研究和零售行业AI落地赋能。

Colugo发布RP2K打榜活动

目前Colugo已经发布了基于PP系列模型的基于RP2K的预训练模型,以及相关实验日志,详情见。欢迎各位开发者参与对RP2K的打榜活动。

相关教程已经发布,您可以通过Goods_Recognition了解PaddleClas的使用方法,PaddleClas的详细使用见其Github官方Repo
目前ColugoMum最高精度达96.91%,全网最高达97.56%。

Originally posted by @thomas-yanxin in ColugoMum/.github#1

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions