欢迎您访问365答案网,请分享给你的朋友!
生活常识 学习资料

处理数据集:整理为特征文件.txt和标签文件.txt

时间:2023-08-31
Part1:将多个文件夹中的.features文件整合在一个txt文件中

背景:该数据集大文件夹包含六个小文件夹,每个小文件夹代表一个类别,其中包含该类别下图片特征的文件,文件原格式无法用python直接打开,所以在读取前需要一步修改文件后缀的步骤。每个单独的文件内容有六行,是提取的各种特征向量,首先尝试将这六个特征向量作为一个特征向量,所以需要把单独文件中的回车符号去掉,以逗号代替,最后在整个文件的数据后(即一个完整的特征向量后)写入回车符,以方便后面对特征文件的进一步处理。

import osfor filename in os.listdir("kvasir-dataset-v2-features"): for filename2 in os.listdir("kvasir-dataset-v2-features/" + filename): portion = os.path.splitext(filename2) # 分离文件名与扩展名 if portion[1] == '.features': # 重新组合文件名和后缀名 newname = portion[0] + '.txt' os.chdir("kvasir-dataset-v2-features/" + filename)#切换路径 os.rename(filename2, newname) filename2 = newname os.chdir("C:/Desktop/itsname")#切换回原路径 with open("kvasir-dataset-v2-features/"+ filename + "/"+ filename2) as f: for line in f.readlines(): line=line.strip('n') with open("kvasir-dataset-v2-features.txt","a") as all: all.write(line + ",") with open("kvasir-dataset-v2-features.txt","a") as all: all.write('n')

Part2:提取标签文件

import osfor filename in os.listdir("kvasir-dataset-v2-features"): for filename2 in os.listdir("kvasir-dataset-v2-features/" + filename): with open("label.txt","a") as all: all.write(filename + 'n')

结果: 结果文件
特征向量(待修整)
标签

Copyright © 2016-2020 www.365daan.com All Rights Reserved. 365答案网 版权所有 备案号:

部分内容来自互联网,版权归原作者所有,如有冒犯请联系我们,我们将在三个工作时内妥善处理。