DL-Art-School/codes/scripts/audio/preparation/spleeter_utils/spleeter_dataset.py

from math import ceil

import numpy as np

from spleeter.audio.adapter import AudioAdapter
from torch.utils.data import Dataset

from data.util import find_audio_files


class SpleeterDataset(Dataset):
    def __init__(self, src_dir, batch_sz, max_duration, sample_rate=22050, partition=None, partition_size=None, resume=None):
        self.batch_sz = batch_sz
        self.max_duration = max_duration
        self.files = find_audio_files(src_dir, include_nonwav=True)
        self.sample_rate = sample_rate

        # Partition files if needed.
        if partition_size is not None:
            psz = int(partition_size)
            prt = int(partition)
            self.files = self.files[prt * psz:(prt + 1) * psz]

        # Find the resume point and carry on from there.
        if resume is not None:
            for i, f in enumerate(self.files):
                if resume in f:
                    break
            assert i < len(self.files)
            self.files = self.files[i:]
        self.loader = AudioAdapter.default()

    def __len__(self):
        return ceil(len(self.files) / self.batch_sz)

    def __getitem__(self, item):
        item = item * self.batch_sz
        wavs = None
        files = []
        ends = []
        for k in range(self.batch_sz):
            ind = k+item
            if ind >= len(self.files):
                break

            #try:
            wav, sr = self.loader.load(self.files[ind], sample_rate=self.sample_rate)
            assert sr == 22050
            # Get rid of all channels except one.
            if wav.shape[1] > 1:
                wav = wav[:, 0]

            if wavs is None:
                wavs = wav
            else:
                wavs = np.concatenate([wavs, wav])
            ends.append(wavs.shape[0])
            files.append(self.files[ind])
            #except:
            #    print(f'Error loading {self.files[ind]}')
        return {
            'audio': wavs,
            'files': files,
            'ends': ends
        }
More fixes 2021-10-10 05:27:14 +00:00			`from math import ceil`

			`import numpy as np`

			`from spleeter.audio.adapter import AudioAdapter`
			`from torch.utils.data import Dataset`

			`from data.util import find_audio_files`


			`class SpleeterDataset(Dataset):`
			`def __init__(self, src_dir, batch_sz, max_duration, sample_rate=22050, partition=None, partition_size=None, resume=None):`
			`self.batch_sz = batch_sz`
			`self.max_duration = max_duration`
			`self.files = find_audio_files(src_dir, include_nonwav=True)`
			`self.sample_rate = sample_rate`

			`# Partition files if needed.`
			`if partition_size is not None:`
			`psz = int(partition_size)`
			`prt = int(partition)`
			`self.files = self.files[prt * psz:(prt + 1) * psz]`

			`# Find the resume point and carry on from there.`
			`if resume is not None:`
			`for i, f in enumerate(self.files):`
			`if resume in f:`
			`break`
			`assert i < len(self.files)`
			`self.files = self.files[i:]`
			`self.loader = AudioAdapter.default()`

			`def __len__(self):`
			`return ceil(len(self.files) / self.batch_sz)`

			`def __getitem__(self, item):`
			`item = item * self.batch_sz`
			`wavs = None`
			`files = []`
			`ends = []`
			`for k in range(self.batch_sz):`
			`ind = k+item`
			`if ind >= len(self.files):`
			`break`

Restore spleeter_splitter The mods don't help - in TF mode, everything is done on the GPU anyways. Something else is going to have to be done to fix this. 2021-10-10 05:55:42 +00:00			`#try:`
			`wav, sr = self.loader.load(self.files[ind], sample_rate=self.sample_rate)`
			`assert sr == 22050`
			`# Get rid of all channels except one.`
			`if wav.shape[1] > 1:`
			`wav = wav[:, 0]`
More fixes 2021-10-10 05:27:14 +00:00
Restore spleeter_splitter The mods don't help - in TF mode, everything is done on the GPU anyways. Something else is going to have to be done to fix this. 2021-10-10 05:55:42 +00:00			`if wavs is None:`
			`wavs = wav`
			`else:`
			`wavs = np.concatenate([wavs, wav])`
			`ends.append(wavs.shape[0])`
			`files.append(self.files[ind])`
			`#except:`
			`# print(f'Error loading {self.files[ind]}')`
More fixes 2021-10-10 05:27:14 +00:00			`return {`
			`'audio': wavs,`
			`'files': files,`
Restore spleeter_splitter The mods don't help - in TF mode, everything is done on the GPU anyways. Something else is going to have to be done to fix this. 2021-10-10 05:55:42 +00:00			`'ends': ends`
			`}`