pytorch下大型数据集(大型图片)的导入方式

脚本专栏 2026/3/28 佚名

3 2 1

使用torch.utils.data.Dataset类处理图片数据时，

1. 我们需要定义三个基本的函数，以下是基本流程

class our_datasets(Data.Dataset):
 
  def __init__(self,root,is_resize=False,is_transfrom=False):
    #这里只是个参考。按自己需求写。
    self.root=root
    self.is_resize=is_resize
    self.is_transfrom=is_transfrom
 
    self.imgs_list=...#这里建议保存的是 图片的路径 而不是 图片的数据
    self.labs_list=...
 
  def __getitem__(self, index):
 
    img_path,lab=self.imgs_list[index],self.labs_list[index]
    
    #这里使用PIL库读取图片数据.
    img_data = Image.open(img_path).convert('RGB')
 
    #这里看自己需要，可以不要
    if self.is_resize:
      img_data = img_data.resize((self.is_resize[0], self.is_resize[1]), Image.ANTIALIAS)
    
    #但是数据转换建议加上，很多时候都会用到
    if self.is_transfrom:
      img_data=self.is_transfrom(img_data)
    return img_data,lab
 
  def __len__(self):
 
    return len(self.imgs_list)

这里，我将读取图片的步骤放到 __getitem__ ，是因为这样放的话，对内存的要求会降低很多，我们只是将数据的路径导入了内存中，当需要读取这个图片数据时，再读取，这样更像是随用随取。如果将这部分放到 __init__ 里面，会一次将图片数据都加载到内存中，如果数据量太大，会直接卡死。

2.Dataset 类返回的数据类型是与你读取时的类型一致的。但是在 pytorch使用时，会提示

TypeError: batch must contain tensors, numbers, dicts or lists; found <class 'PIL.Image.Image'>

通常，在数据了不大时，我一般都是在读取数据后加一句，转换成 numpy.array类型。

但是，在处理较大型的数据时，这样会很慢。

这时候，我建议直接使用 torchvision来进行数据转换。

is_transfrom=torchvision.transforms.ToTensor()

将上例代码加入 Dataset类中，这样就会快很多。

以上这篇pytorch下大型数据集(大型图片)的导入方式就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持。

pytorch,数据集,图片,导入

标签：

pytorch,数据集,图片,导入

免责声明：本站文章均来自网站采集或用户投稿，网站不提供任何软件下载或自行开发的软件！如有用户或公司发现本站内容信息存在侵权行为，请邮件告知！ 858582#qq.com

评论“pytorch下大型数据集(大型图片)的导入方式”

pytorch下大型数据集(大型图片)的导入方式

暂无“pytorch下大型数据集(大型图片)的导入方式”评论...

www.imxmx.com 杰晶网络

8,675无损音乐

1,324高清电影

213破解软件

120,141站长资源

最新文章

群星《奔赴！万人现场第2期》[FLAC/分轨][5

2026/3/28

群星《奇妙浪一夏 (上海迪士尼度假区音乐)》

2026/3/28

群星《奇妙浪一夏 (上海迪士尼度假区音乐)》

2026/3/28

【古典音乐】詹姆斯·高威《季节》1993[WAV+

2026/3/28

贝拉芳蒂《卡里普索之王》SACD[WAV+CUE]

2026/3/28

一句话新闻

苹果官宣WWDC 2024！预计会有大批AI功能 - 2026/3/28

3月27日消息，苹果宣布2024年全球开发者大会（WWDC）将于6月10日至6月14日举行，巧合的是，这次大会与端午假期重合。

苹果官方表示：

在线参加 Apple 每年规模最大的开发者盛会。亲眼见证 Apple 最新平台、技术和工具的发布。了解如何创建和改进你的 App 和游戏。与 Apple 设计师和工程师互动交流，与全球开发者社区建立联系。以上活动均免费在线举行。

探索各种新的工具、框架和功能，助力你打造出理想的 App 和游戏。通过视频讲座学习新技能，与 Apple 专家进行一对一会面，以推进你的项目，完善你的构思。

Swift Student Challenge 旨在支持和鼓舞下一代开发者、创作者和企业家。太平洋时间 3 月 28 日，我们将公布今年的获奖者名单。获奖者将有资格参加在 Apple Park 举办的特别活动。我们还会选出 50 名杰出获胜者，他们将受邀前往库比提诺，获得为期三天的非凡体验，包括参加 Apple Park 的特别活动。

pytorch下大型数据集(大型图片)的导入方式

pytorch,数据集,图片,导入

pytorch 实现将自己的图片数据处理成可以训练的图片类型

Python 实现训练集、测试集随机划分

评论“pytorch下大型数据集(大型图片)的导入方式”

RTX 5090要首发性能要翻倍！三星展示GDDR7显存

更新动态

友情链接

pytorch下大型数据集(大型图片)的导入方式

pytorch,数据集,图片,导入

pytorch 实现将自己的图片数据处理成可以训练的图片类型

Python 实现训练集、测试集随机划分

评论“pytorch下大型数据集(大型图片)的导入方式”

RTX 5090要首发 性能要翻倍！三星展示GDDR7显存

更新动态

友情链接

RTX 5090要首发性能要翻倍！三星展示GDDR7显存