ndb796 / deep-learning-paper-review-and-practice Goto Github PK
View Code? Open in Web Editor NEW꼼꼼한 딥러닝 논문 리뷰와 코드 실습
꼼꼼한 딥러닝 논문 리뷰와 코드 실습
Attention is All You Need 논문에서 Transformer 실습을 Colab에 올리셨는데, 해당 부분에 데이터 전처리 과정에서 tokenizer로 spacy를 사용하신 부분이 새 버전으로 업데이트 되면서 문제를 일으키고 있습니다.
<기존>
import spacy
spacy_en = spacy.load('en') # 영어 토큰화(tokenization)
spacy_de = spacy.load('de') # 독일어 토큰화(tokenization)
<변경 후>
import spacy
spacy_en = spacy.load('en_core_web_sm') # 영어 토큰화(tokenization)
spacy_de = spacy.load('de_core_news_sm') # 독일어 토큰화(tokenization)
확인 부탁드립니다. 감사합니다.
\code_practices\Sequence_to_Sequence_with_Attention_Tutorial.ipynb
\code_practices\Sequence_to_Sequence_with_LSTM_Tutorial.ipynb
from torchtext.data import Field, BucketIterator # An error occured!!
ImportError Traceback (most recent call last)
in <cell line: 1>()
----> 1 from torchtext.data import Field, BucketIterator
2
3 SRC = Field(tokenize=tokenize_de, init_token="", eos_token="", lower=True)
4 TRG = Field(tokenize=tokenize_en, init_token="", eos_token="", lower=True)
ImportError: cannot import name 'Field' from 'torchtext.data' (/usr/local/lib/python3.10/dist-packages/torchtext/data/init.py)
NOTE: If your import is failing due to a missing package, you can
manually install dependencies using either !pip or !apt.
To view examples of installing some common dependencies, click the
"Open Examples" button below.
유튜브 영상 잘 보고 있습니다!
혹시나 YOLO나 EfficientNet도 계획 있으신지 궁금합니다
안녕하세요. 동영상 잘 보고 있습니다.
4년전 딥러닝 조금 손대다가 다시 학습하려는데, 나동빈님 자료를 마주하게 되었습니다.
여러번 보고 또 봐야 할듯 기억도 가물가물하고, 그때보다 더 발전된 모델들도 많아졌습니다.
NLP 모델중 GPT 시리즈도 설명 계획 있으신가요?
그리고 Word2Vec 등 워디 임베딩에 대한 논문들도 분석 부탁 드립니다~!!
resnet 18을 활용하여 custom dataset을 만들어 실행중인데 cuda memory가 부족하다 뜨는데 그래픽 카드 문제일까요?
ㅁ 오류난 행 :
train_dataset, valid_dataset, test_dataset = Multi30k.splits(exts = (".de", ".en"), fields = (SRC, TRG))
ㅁ 오류코드 :
[ssl: certificate_verify_failed] certificate verify failed: hostname mismatch, certificate is not valid for 'www.quest.dcs.shef.ac.uk'. (_ssl.c:1007)
ㅁ 해결방법 :
오류난 행 위에 아래 코드를 우선 실행:
$import ssl
$ssl._create_default_https_context = ssl._create_unverified_context
2 아래 깃허브 링크에서 다음 파일들을 컴퓨터에 다운로드
.링크 : https://github.com/zaidhassanch/PointerNetworks/tree/6ccd5ebad877c9fbc10ac3af10114b4a6097700b/data/multi30k
.다운로드파일 : (총 7개)
코랩 가상환경의 파일 디렉토리에서,
3-1. data 폴더 추가,
3-2. 하위 디렉토리에 multi30k 폴더 추가
3-3 data/multi30k 에 2번에서 다운받은 파일들을 모두 직접 업로드
기존의 오류난 코드를 아래 코드로 대체(마지막에, root = 'data' 추가)
train_dataset, valid_dataset, test_dataset = Multi30k.splits(exts = (".de", ".en"), fields = (SRC, TRG), root = 'data')
실행
Attention is All You Need 실습코드 및 영상 잘 봤습니다!
BERT에 대한 계획은 아직 없으신지 궁금합니다.
I'm looking onto your code, and I found that the loss function is a little different from the paper. In the paper, there's the Dissim term, but your code doesn't have it. Did you remove this on purpose?
Note: I meant loss=cost here
안녕하세요! 올려주신 코드를 바탕으로 이미지 스타일을 추출하는 중입니다. multiprocessing을 통해서 이미지를 한번에 여러개를 만들고 싶어 코드를 작성했는데 image_loader 함수 부분 중 image = loader(image).unsqueeze(0) 이부분에서 다음으로 넘어가지 못하고 계속 멈춰있는것을 확인했습니다. 혹시 해결법을 하실지 궁금하여 질문남깁니다!
torchtext의 버전이 업데이트 된건지 그냥 코드는 실행이 안되고
from torchtext.data
이 부분을
from torchtext.legacy.data
로 바꿔줘야지 정상실행됩니다.
그리고 해당 코드에서 multi30k 데이터셋을 불러와서 split 하는 코드가 너무 오래 걸리는데.. 원래 그런가요?
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.