[toc]
基于 fiftyone 写的一个管理数据的小东西
- torch (安装torch的情况下可以使用自带模型或者是新加的嵌入模型)
- dash (数据集分析使用)
- diskcache (数据集分析使用)
0.22.1 版本发布
新增导入标签的方式,现在导入新数据可以选择 new
,即完全使用新传入的标注作为最终标注
- 修复导入数据时使用
merge
,nms方法可能造成的部分box丢失
0.22 版本发布
新增 T.DataAnalyer
功能,在线分析目标检测数据集情况,使用示例如下:
dataset=session.dataset.limit(10)
classes=["dog","cat"]
analyer=T.DataAnalyer(dataset,classes)
# 在线查看
analyer.show()
# 导出表格到 test.xlsx
analyer.export2excel("test.xlsx")
历次更新重点见changelog.md
embedding
: 存放着样本嵌入ground_truth
: 存放样本标注model_predict
: 存放模型预测结果chiebot_ID
: 比赛样本原始IDxml_md5
: 当前样本的xml md5img_quality
: 样本图片质量,暂未用上data_source
: 样本数据来源chiebot_sample_tags
: 类似sample tags,用来标志样本additions
: 其他一些奇奇怪怪的信息
im_sim_qdrant
: 存放着使用 qdrant 计算数据的相似性
参见使用说明
- 记录额外信息
- 自定义后端proto来支持labelimg,labelme,labelhomo 之类的工具
- 优化一些工具api的使用
- rpc模型支持
- 已选数据一键导出
- 多人操作问题
- 目标检测多种导出格式支持
- 优化anno数据导入导出和原始的一致性
- 以图搜图
- io繁忙的情况 tqdm卡住
- 重新建立数据集时会话断开链接,需要重启整个程序