请问我需要调整输入图片尺寸来得到更好的语义分割效果吗？ about vit-adapter HOT 4 CLOSED

czczup commented on May 29, 2024

请问我需要调整输入图片尺寸来得到更好的语义分割效果吗？

from vit-adapter.

Comments (4)

czczup commented on May 29, 2024

您好，由于我水平有限，在阅读论文和代码后仍然无法解决下面这个问题：我把在Cityscapes test set上训练的模型用于我自己的数据集做语义分割，对应config是“mask2former_beit_adapter_large_896_80k_cityscapes_ss.py”，数据集图片尺寸为1920_1080，我没有进行任何操作直接用“image_demo.py”进行语义分割，运行没有报错，得到1920_1080的语义分割图片。请问这个模型的输入图片尺寸是任意的吗？我是否需要将图片尺寸调整为某个尺寸（例如cityscapes的图片尺寸）以获得更好的语义分割效果？

用image_demo.py测试会按照“mask2former_beit_adapter_large_896_80k_cityscapes_ss.py”这个config中的设置进行resize, 这里具体是resize到1024x2048然后用896x896的滑动窗口预测，模型要求输入图像必须是896x896，不过用了滑动窗口预测之后，输入图像可以是任意分辨率

from vit-adapter.

githubcvcv commented on May 29, 2024

您好，由于我水平有限，在阅读论文和代码后仍然无法解决下面这个问题：我把在Cityscapes test set上训练的模型用于我自己的数据集做语义分割，对应config是“mask2former_beit_adapter_large_896_80k_cityscapes_ss.py”，数据集图片尺寸为1920_1080，我没有进行任何操作直接用“image_demo.py”进行语义分割，运行没有报错，得到1920_1080的语义分割图片。请问这个模型的输入图片尺寸是任意的吗？我是否需要将图片尺寸调整为某个尺寸（例如cityscapes的图片尺寸）以获得更好的语义分割效果？

用image_demo.py测试会按照“mask2former_beit_adapter_large_896_80k_cityscapes_ss.py”这个config中的设置进行resize, 这里具体是resize到1024x2048然后用896x896的滑动窗口预测，模型要求输入图像必须是896x896，不过用了滑动窗口预测之后，输入图像可以是任意分辨率

请问不同的输入图片尺寸会影响语义分割效果吗？例如使用与1024×2048相似比例的图片，效果会更好吗？

from vit-adapter.

czczup commented on May 29, 2024

您好，由于我水平有限，在阅读论文和代码后仍然无法解决下面这个问题：我把在Cityscapes test set上训练的模型用于我自己的数据集做语义分割，对应config是“mask2former_beit_adapter_large_896_80k_cityscapes_ss.py”，数据集图片尺寸为1920_1080，我没有进行任何操作直接用“image_demo.py”进行语义分割，运行没有报错，得到1920_1080的语义分割图片。请问这个模型的输入图片尺寸是任意的吗？我是否需要将图片尺寸调整为某个尺寸（例如cityscapes的图片尺寸）以获得更好的语义分割效果？

用image_demo.py测试会按照“mask2former_beit_adapter_large_896_80k_cityscapes_ss.py”这个config中的设置进行resize, 这里具体是resize到1024x2048然后用896x896的滑动窗口预测，模型要求输入图像必须是896x896，不过用了滑动窗口预测之后，输入图像可以是任意分辨率

请问不同的输入图片尺寸会影响语义分割效果吗？例如使用与1024×2048相似比例的图片，效果会更好吗？

效果肯定是这个尺寸的图片最好，不过别的尺寸影响应该也不大（因为测试时的resize会保持输入图像的长宽比），你可以试试。

from vit-adapter.

githubcvcv commented on May 29, 2024

您好，由于我水平有限，在阅读论文和代码后仍然无法解决下面这个问题：我把在Cityscapes test set上训练的模型用于我自己的数据集做语义分割，对应config是“mask2former_beit_adapter_large_896_80k_cityscapes_ss.py”，数据集图片尺寸为1920_1080，我没有进行任何操作直接用“image_demo.py”进行语义分割，运行没有报错，得到1920_1080的语义分割图片。请问这个模型的输入图片尺寸是任意的吗？我是否需要将图片尺寸调整为某个尺寸（例如cityscapes的图片尺寸）以获得更好的语义分割效果？

用image_demo.py测试会按照“mask2former_beit_adapter_large_896_80k_cityscapes_ss.py”这个config中的设置进行resize, 这里具体是resize到1024x2048然后用896x896的滑动窗口预测，模型要求输入图像必须是896x896，不过用了滑动窗口预测之后，输入图像可以是任意分辨率

请问不同的输入图片尺寸会影响语义分割效果吗？例如使用与1024×2048相似比例的图片，效果会更好吗？

效果肯定是这个尺寸的图片最好，不过别的尺寸影响应该也不大（因为测试时的resize会保持输入图像的长宽比），你可以试试。

好的，谢谢！非常感谢！

from vit-adapter.

请问我需要调整输入图片尺寸来得到更好的语义分割效果吗？ about vit-adapter HOT 4 CLOSED

Comments (4)

Related Issues (20)

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent