把图片文件已解压到./dataset/multidata_zol/img/ 目录下。断点调试没有读取到图片文件，按照img_path去图片路径下搜索发现存在这个图片。<br

不是没有读取到文件，是因为有几张图片的大小是1*1，过res50的时候会报错 <p

不是没有读取到文件，是因为有几张图片的大小是1*1，过res50的时候会报错 </bl

他有些句子没有对应的图片，img这个列表是空的，直接len(img[0])就会报错 <p dir="auto"

读取img文件失败 about mimn HOT 8 OPEN

amethystia commented on August 17, 2024 1

读取img文件失败

from mimn.

Comments (8)

APPLE-XMT commented on August 17, 2024

你好我想请问一下这个问题你解决了吗

from mimn.

ToriZumi commented on August 17, 2024

为什么现在数据集文件都不一样了

from mimn.

Wangjii commented on August 17, 2024

不是没有读取到文件，是因为有几张图片的大小是1*1，过res50的时候会报错

from mimn.

pppxk commented on August 17, 2024

不是没有读取到文件，是因为有几张图片的大小是1*1，过res50的时候会报错

请问这个问题您解决了嘛？

from mimn.

Wangjii commented on August 17, 2024

不是没有读取到文件，是因为有几张图片的大小是1*1，过res50的时候会报错

请问这个问题您解决了嘛？

因为没有其他途径获得完好的数据集，所以将有问题的图片跳过了。

from mimn.

pppxk commented on August 17, 2024

不是没有读取到文件，是因为有几张图片的大小是1*1，过res50的时候会报错

请问这个问题您解决了嘛？

因为没有其他途径获得完好的数据集，所以将有问题的图片跳过了。

请问您有把所有图片的尺寸都改成224*224吗？我发现如果图片的分辨率很高的话也是会报这个错误的

from mimn.

triangleXIV commented on August 17, 2024

他有些句子没有对应的图片，img这个列表是空的，直接len(img[0])就会报错

from mimn.

triangleXIV commented on August 17, 2024

他有些句子没有对应的图片，img这个列表是空的，直接len(img[0])就会报错

自己研究了一下，将data_utils.py的read_img这个函数换成如下我重写的函数就行了，原理就是把所有数据都放到GPU上，之前的数据是放在内存上的，不好管理，8G显存3070读取整个数据集无报错。

def read_img(self, imgs_path):
    imgs = []
    with torch.no_grad():
        self.cnn_extractor.to('cuda')
        for j in range(len(imgs_path)):
            img_path = imgs_path[j].strip().replace('\'', '')
            try:
                img = Image.open('./datasets/img/' + img_path).convert('RGB')
                input = self.transform_img(img).unsqueeze(0).to('cuda')
                output = self.cnn_extractor(input).squeeze()
                imgs.append(output)
                img.close()
            except:
                error = 1
    torch.cuda.empty_cache()
    embed_dim_img = len(imgs[0])
    #embed_dim_img = 2048
    img_features = torch.zeros(self.max_img_len, embed_dim_img)
    num_imgs = len(imgs)
    if num_imgs >= self.max_img_len:
        for i in range(self.max_img_len):
            img_features[i,:] = imgs[i]
    else:
        for i in range(self.max_img_len):
            if i < num_imgs:
                # img_features[(self.max_img_len-num_imgs)+i,:] = imgs[i]
                img_features[i, :] = imgs[i]
            else:
                break
    return img_features, min(self.max_img_len, num_imgs)

from mimn.

读取img文件失败 about mimn HOT 8 OPEN

Comments (8)

Related Issues (9)

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent