From a9fbe81f9814317cca2c84157ba6dab02167a5a2 Mon Sep 17 00:00:00 2001
From: mrq <mrq@ecker.tech>
Date: Tue, 17 Sep 2024 15:25:12 -0500
Subject: [PATCH] oops

---
 vall_e/data.py           |  6 ++++--
 vall_e/emb/similar.py    | 24 ++++++++++++++++--------
 vall_e/utils/__init__.py |  3 ++-
 3 files changed, 22 insertions(+), 11 deletions(-)

diff --git a/vall_e/data.py b/vall_e/data.py
index db9b920..0bd23f6 100755
--- a/vall_e/data.py
+++ b/vall_e/data.py
@@ -1373,6 +1373,10 @@ def create_dataset_metadata( skip_existing=True ):
 		name = name.replace(root, "")
 
 		speaker_name = name
+		"""
+		if "LibriTTS-R" in speaker_name:
+			speaker_name = speaker_name.replace("LibriTTS-R", "LibriVox")
+		"""
 
 		metadata_path = Path(f"{metadata_root}/{speaker_name}.json")
 		metadata_path.parents[0].mkdir(parents=True, exist_ok=True)
@@ -1593,8 +1597,6 @@ if __name__ == "__main__":
 		_logger.info(json.dumps(dataset))
 	elif args.action == "metadata":
 		create_dataset_metadata()
-	elif args.action == "similarity-metadata":
-		create_dataset_similarity_metadata()
 	elif args.action == "sample":
 		train_dl, subtrain_dl, val_dl = create_train_val_dataloader()
 
diff --git a/vall_e/emb/similar.py b/vall_e/emb/similar.py
index 3b49473..f2507fd 100644
--- a/vall_e/emb/similar.py
+++ b/vall_e/emb/similar.py
@@ -20,6 +20,7 @@ import torchaudio.functional as F
 import torchaudio.transforms as T
 
 from ..config import cfg
+from ..utils import truncate_json
 
 # need to validate if this is safe to import before modifying the config
 from .g2p import encode as phonemize
@@ -142,8 +143,11 @@ def process(
 			sorted_similarities[filename_b][filename_a] = similarity
 
 	metadata = None	
-	if metadata_path is not None and metadata_path.exists():
-		metadata = json.loads(open( metadata_path, "r", encoding="utf-8" ).read())
+	if metadata_path is not None:
+		if metadata_path.exists():
+			metadata = json.loads(open( metadata_path, "r", encoding="utf-8" ).read())
+		else:
+			metadata = {}
 
 	# sort similarities scores
 	for filename, sorted_similarity in sorted_similarities.items():
@@ -152,15 +156,19 @@ def process(
 		most_filename, most_score = sorted_similarities[filename][0]
 		least_filename, least_score = sorted_similarities[filename][-1]
 
-		if metadata is not None and filename in metadata:
-			metadata[filename] = sorted_similarities[filename]
+		if metadata is not None:
+			if filename not in metadata:
+				metadata[filename] = {}
+			metadata[filename]["similar"] = sorted_similarities[filename]
 
 		if verbose:
 			print( f'{filename}:\n\tMost: {most_filename} ({most_score:.3f})\n\tLeast: {least_filename} ({least_score:.3f})' )
 
 	if metadata is not None:
 		with open(str(metadata_path), "w", encoding="utf-8") as f:
-			f.write( json.dumps( metadata ) )
+			serialized = json.dumps( metadata )
+			serialized = truncate_json( serialized )
+			f.write( serialized )
 
 	return sorted_similarities
 
@@ -181,14 +189,14 @@ def main():
 	args = parser.parse_args()
 
 	if args.use_dataset:		
-		root = str(cfg.data_dir)
-
 		cfg.metadata_dir.mkdir(parents=True, exist_ok=True)
 
 		def add( dir, type="training", audios=True, texts=True ):
 			name = str(dir)
-			name = name.replace(root, "")
+			name = name.replace(str(cfg.data_dir), "")
 			speaker_name = name
+			if "LibriTTS-R" in speaker_name:
+				speaker_name = speaker_name.replace("LibriTTS-R", "LibriVox")
 
 			process(
 				speaker_path=cfg.data_dir / speaker_name,
diff --git a/vall_e/utils/__init__.py b/vall_e/utils/__init__.py
index d79e335..70bc823 100755
--- a/vall_e/utils/__init__.py
+++ b/vall_e/utils/__init__.py
@@ -9,5 +9,6 @@ from .utils import (
     do_gc,
     set_seed,
     passes_policy,
-    get_devices
+    get_devices,
+    truncate_json
 )
\ No newline at end of file