ardha27 / ai-song-cover-sovits Goto Github PK

All in One Version : Youtube WAV Download, Separating Vocal, Splitting Audio, Training, and Inference Using Google Colab

Home Page: https://ko-fi.com/ardhach

Jupyter Notebook 100.00%

ai song-covers sovits svc

ai-song-cover-sovits's Introduction

AI-Song-Cover-SOVITS

All in One Version : Youtube WAV Download, Separating Vocal, Splitting Audio, Training, and Inference Using Google Colab.

Leave A Star if This Repo Was Helpful

Tutorial (Indonesian)

https://youtu.be/v5MwAqQTc6Q

Google Colab

ai-song-cover-sovits's People

Contributors

Stargazers

Watchers

Forkers

nobutu hyadawild enierl zerenidel yuukn idhamthoriqbot andillk azfm21 piras45 layla0022 iralis27 hikariiisrein techthiyanes ankarakata f2face ekadharmaa adityarahmanda ifgcguitarclub mhmdrzz jzwrld7 naerinna rizkiwibu alsqardhawy videfrelan mr4sr firzaelbuho kazky rhanz12x cherlievalentina-6922 marklee2002 zorox124h dianemeee all-forks didiabdillah isaan09 richmarpaung dayyxz imxinz yalla2016 baysdr rammmpr siwndqa phamtung22 renagge39 naufalraism pakuningratan accioraskalana ryuujo kenzarz earlen123 fadlay eifal akungithub130 accelerator114 lioonzz thisismyracle egerdm-ai im-hanzou grandfleet peyoreo baronco renufuss ikaayoung01 codmus momo-deviluk intan-bisnis glitchkeseleo yonnnkun marker0724 fallenrayveil syahdafahreza veline24 farismnrr aiprojectchiwa thmnseo javaweb2019 dndhh yanzzeross sjshebeu ha7sh17 denysmiller m-liv rebecasarai laynz28 witchfindertr yunyan17540 zakirkun mfarels andy2306 mkygogo ebengacom hiiamtin

ai-song-cover-sovits's Issues

inference

May I ask if you can use the mp3 or wav file you uploaded for inference?

No tutorial videos; the video is no longer available.

Pertama
Jika kalian melakukan Training, pasti akan sangat menggunakan storage yang sangat besar,kalian bisa menghapus file D_*.pth dan G_*.pth pada google drive kalian yang sudah lama dan tinggalkan D _*.pth dan G _*.pth yang terbaru.
PS: Kalian gak usah ngelakuin ini,karena setelah gw lihat ternyata setelah 3 kali wav epoch pasti file terlamanya bakal di hapus

Kedua
Jika ditengah-tengah training kalian mendapatkan Runtime Disconnect kalian bisa tetap melanjutkan training dengan cara memindahkan file so-vits-svc-fork ke google drive lain dan memulai melanjutkannya pada akun lain dengan catatan kalian harus membuat data set yang sama dari yang kalian pakai sebelumnya setelah itu kalian dapat melanjutkan proses training

Oh, Iya.Informasi yang agak gak penting sih.

Waktu kita training,wave epoch akan di perbarui sekitar 7-9 menit tergantung data set yang kalian pake.
Kalian akan menghabiskan waktu sekitar satu jam untuk training 240 epoch.
Jadi jika target epoch kalian 1000,maka kalian akan membutuhkan waktu sekitar 3 jam - 4 jam

Itu aja sih tips dari gw, mungkin kalo nemu lagi bakal gw taruh disini.
@ardha27 Mohon koreksinya

5. Inference

Mas, ini kenapa ya error bagian display(AUDIO())?

Model: https://huggingface.co/spaces/zomehwh/vits-models/blob/main/pretrained_models/alice/alice.pth (Blue Archive: Tendou Arisu)

Error logs:

[18:58:20] INFO     [18:58:20] Version: 3.14.1                    

---------------------------------------------------------------------------

ValueError                                Traceback (most recent call last)

[<ipython-input-20-26778c592e41>](https://localhost:8080/#) in <cell line: 12>()
     10 get_ipython().system('svc infer {AUDIO}.wav -m {MODEL} -na -t {PITCH}')
     11 # Try comment this line below if you got Runtime Error
---> 12 display(Audio(f"/content/{AUDIO}.out.wav", autoplay=True, rate=22050))

2 frames

[/usr/local/lib/python3.10/dist-packages/IPython/lib/display.py](https://localhost:8080/#) in _validate_and_normalize_with_numpy(data, normalize)
    157         waveobj = wave.open(fp,mode='wb')
    158         waveobj.setnchannels(nchan)
--> 159         waveobj.setframerate(rate)
    160         waveobj.setsampwidth(2)
    161         waveobj.setcomptype('NONE','NONE')

ValueError: could not convert string to float: '/content//content/separated/htdemucs/audio/vocals.out.wav'

cp: cannot stat 'configs/44k/config.json': No such file or directory

pre-resample

bang ini kenapa gak sampe 100%?

Inference /command not found

Halo kak! I've been trying to use your tool to train my own voice and some artists since your latest video popped up on my tiktok's fyp. Jadi masalahnya muncul itu pas aku udah selesai train suaranya aku, terus mau ke tahap inference tapi awalnya kena disconnecting issue, kan. Nah katamu bisa pakai comman ctrl + /, tapi aku gak ngelakuin itu malah aku ngedisconnect dan hapus runtime. Karena aku pikir aku juga udah train suara aku tadinya dan filenya kesimpan di gdrive aku langsung aja, ke langkah 1, 2, dan 5 dan ini yang muncul kak.

Aku masukin yang model dan confignya folder trainnya dari GDrive tadi kak, kamu bisa liat sendiri di gambar bawah ini, ya.... tapi malah muncul yang kayak digambar, gimana ya kak? Aku bingung sendiri juga jadinya T_T

Atau apa kita tidak bisa kak pakai yang dari GDrive untuk tahap nomor 5? atau harus upload/buat clone di github?