From af50afe22290fc404c9e54e3243df99a5aca6ce9 Mon Sep 17 00:00:00 2001
From: James Betker <jbetker@gmail.com>
Date: Mon, 21 Feb 2022 19:11:10 -0700
Subject: [PATCH] pairedvoice: error out if clip is too short

---
 codes/data/audio/paired_voice_audio_dataset.py | 3 +++
 1 file changed, 3 insertions(+)

diff --git a/codes/data/audio/paired_voice_audio_dataset.py b/codes/data/audio/paired_voice_audio_dataset.py
index d6123229..b7d40c95 100644
--- a/codes/data/audio/paired_voice_audio_dataset.py
+++ b/codes/data/audio/paired_voice_audio_dataset.py
@@ -140,6 +140,9 @@ class TextWavLoader(torch.utils.data.Dataset):
             tseq, wav, text, path = self.get_wav_text_pair(self.audiopaths_and_text[index])
             if text is None or len(text.strip()) == 0:
                 raise ValueError
+            if wav is None or wav.shape[-1] < (.1 * self.sample_rate):
+                # Ultra short clips are also useless (and can cause problems within some models).
+                raise ValueError
             cond, cond_is_self = load_similar_clips(self.audiopaths_and_text[index][0], self.conditioning_length, self.sample_rate,
                                       n=self.conditioning_candidates) if self.load_conditioning else (None, False)
         except: