DL-Art-School

Author	SHA1	Message	Date
James Betker	b4269af61b	fix circular deps	2022-05-27 11:44:27 -06:00
James Betker	34ee1d0bc3	mdf	2022-05-27 11:40:47 -06:00
James Betker	9852599b34	tfd5 - with clvp!	2022-05-27 09:49:10 -06:00
James Betker	3db862dd32	adf update	2022-05-27 09:25:53 -06:00
James Betker	48aab2babe	ressurect ctc code gen with some cool new ideas	2022-05-24 14:02:33 -06:00
James Betker	f4a97ca0a7	and this	2022-05-23 10:38:28 -06:00
James Betker	874de1775d	Update mdf spectral	2022-05-23 10:37:15 -06:00
James Betker	36dd4eb61f	no grads for mel injectors	2022-05-23 10:34:53 -06:00
James Betker	4093e38717	revert flat diffusion back...	2022-05-22 23:10:58 -06:00
James Betker	07f7be24ce	:/	2022-05-22 20:00:55 -06:00
James Betker	c0bc466aad	mdf for shortened mel test	2022-05-22 19:29:20 -06:00
James Betker	2798bfab8c	Revert "update mdf for legacy try" This reverts commit `693b19ea3b`.	2022-05-22 19:22:44 -06:00
James Betker	693b19ea3b	update mdf for legacy try	2022-05-22 16:37:02 -06:00
James Betker	57d6f6d366	Big rework of flat_diffusion Back to the drawing board, boys. Time to waste some resources catching bugs....	2022-05-22 08:09:33 -06:00
James Betker	db38672dae	precompute diffusion embeddings for from_codes	2022-05-22 06:45:57 -06:00
James Betker	ea21a8b107	Update music_diffusion_fid to support waveform diffusion from codes	2022-05-22 05:23:54 -06:00
James Betker	e0bf3a0ddc	Save myself some time in the future	2022-05-20 17:18:35 -06:00
James Betker	e9fb2ead9a	m2v stuff	2022-05-20 11:01:17 -06:00
James Betker	c9c16e3b01	misc updates	2022-05-19 13:39:32 -06:00
James Betker	7213ad2b89	Do grad reduction	2022-05-17 17:59:40 -06:00
James Betker	8202b9f39c	some stuff	2022-05-15 21:50:54 -06:00
James Betker	ab5acead0e	add exp loss for diffusion models	2022-05-15 21:50:38 -06:00
James Betker	9118f58849	uncomment music projector..	2022-05-09 09:19:26 -06:00
James Betker	74dd095326	a	2022-05-08 18:54:09 -06:00
James Betker	1177c35dec	music fid updates	2022-05-08 18:49:39 -06:00
James Betker	6c8032b4be	more work	2022-05-06 21:56:49 -06:00
James Betker	d8925ccde5	few things with gap filling	2022-05-06 14:33:44 -06:00
James Betker	b83b53cf84	norm mel	2022-05-06 00:49:54 -06:00
James Betker	47662b9ec5	some random crap	2022-05-04 20:29:23 -06:00
James Betker	6655f7845a	add pixel shuffling for 1d cases	2022-05-04 08:03:09 -06:00
James Betker	c42c53e75a	Add a trainable network for converting a normal distribution into a latent space	2022-05-02 09:47:30 -06:00
James Betker	f4254609c1	MDF around and around in circles........	2022-05-01 23:04:56 -06:00
James Betker	e208d9fb80	gate augmentations with a flag	2022-04-28 10:09:22 -06:00
James Betker	3f67cb2023	music diffusion fid adjustments	2022-04-28 10:08:55 -06:00
James Betker	f02b01bd9d	reverse univnet classifier	2022-04-20 21:37:55 -06:00
James Betker	b1c2c48720	music diffusion fid	2022-04-20 00:28:03 -06:00
James Betker	3cad1b8114	more fixes	2022-04-11 15:18:44 -06:00
James Betker	6dea7da7a8	another fix	2022-04-11 12:29:43 -06:00
James Betker	f2c172291f	fix audio_diffusion_fid for autoregressive latent inputs	2022-04-11 12:08:15 -06:00
James Betker	8ea5c307fb	Fixes for training the diffusion model on autoregressive inputs	2022-04-11 11:02:44 -06:00
James Betker	048f6f729a	remove lightweight_gan	2022-04-07 23:12:08 -07:00
James Betker	6fc4f49e86	some dumb stuff	2022-04-07 11:32:34 -06:00
James Betker	035bcd9f6c	fwd fix	2022-04-01 16:03:07 -06:00
James Betker	9b90472e15	feed direct inputs into gd	2022-03-26 08:36:19 -06:00
James Betker	2a29a71c37	attempt to force meaningful codes by adding a surrogate loss	2022-03-26 08:31:40 -06:00
James Betker	45804177b8	more stuff	2022-03-25 00:03:18 -06:00
James Betker	d4218d8443	mods	2022-03-24 23:31:20 -06:00
James Betker	9c79fec734	update adf	2022-03-24 21:20:29 -06:00
James Betker	07731d5491	Fix ET	2022-03-24 21:20:22 -06:00
James Betker	b0d2827fad	flat0	2022-03-24 11:30:40 -06:00
James Betker	be5f052255	misc	2022-03-22 11:40:56 -06:00
James Betker	963f0e9cee	fix unscaler	2022-03-22 11:40:02 -06:00
James Betker	1ad18d29a8	Flat fixes	2022-03-21 14:43:52 -06:00
James Betker	c5000420f6	more arbitrary fixes	2022-03-17 17:45:44 -06:00
James Betker	c14fc003ed	flat diffusion	2022-03-17 17:45:27 -06:00
James Betker	428911cd4d	flat diffusion network	2022-03-17 10:53:56 -06:00
James Betker	bf08519d71	fixes	2022-03-17 10:53:39 -06:00
James Betker	95ea0a592f	More cleaning	2022-03-16 12:05:56 -06:00
James Betker	d186414566	More spring cleaning	2022-03-16 12:04:00 -06:00
James Betker	8b376e63d9	More improvements	2022-03-16 10:16:34 -06:00
James Betker	54202aa099	fix mel normalization	2022-03-16 09:26:55 -06:00
James Betker	8437bb0c53	fixes	2022-03-15 23:52:48 -06:00
James Betker	3f244f6a68	add mel_norm to std injector	2022-03-15 22:16:59 -06:00
James Betker	f563a8dd41	fixes	2022-03-15 21:43:00 -06:00
James Betker	1e3a8554a1	updates to audio_diffusion_fid	2022-03-15 11:35:09 -06:00
James Betker	7929fd89de	Refactor audio-style models into the audio folder	2022-03-15 11:06:25 -06:00
James Betker	e045fb0ad7	fix clip grad norm with scaler	2022-03-13 16:28:23 -06:00
James Betker	08599b4c75	fix random_audio_crop injector	2022-03-12 20:42:29 -07:00
James Betker	c4e4cf91a0	add support for the original vocoder to audio_diffusion_fid; also add a new "intelligibility" metric	2022-03-08 15:53:27 -07:00
James Betker	3e5da71b16	add grad scaler scale to metrics	2022-03-08 15:52:42 -07:00
James Betker	d1dc8dbb35	Support tts9	2022-03-05 20:14:36 -07:00
James Betker	93a3302819	Push training_state data to CPU memory before saving it For whatever reason, keeping this on GPU memory just doesn't work. When you load it, it consumes a large amount of GPU memory and that utilization doesn't go away. Saving to CPU should fix this.	2022-03-04 17:57:33 -07:00
James Betker	6000580e2e	df	2022-03-04 13:47:00 -07:00
James Betker	382681a35d	Load diffusion_fid DVAE into the correct cuda device	2022-03-04 13:42:14 -07:00
James Betker	e1052a5e32	Move log consensus to train for efficiency	2022-03-04 13:41:32 -07:00
James Betker	ce6dfdf255	Distributed "fixes"	2022-03-04 12:46:41 -07:00
James Betker	3ff878ae85	Accumulate loss & grad_norm metrics from all entities within a distributed graph	2022-03-04 12:01:16 -07:00
James Betker	f87e10ffef	Make deterministic sampler work with distributed training & microbatches	2022-03-04 11:50:50 -07:00
James Betker	2d1cb83c1d	Add a deterministic timestep sampler, with provisions to employ it every n steps	2022-03-04 10:40:14 -07:00
James Betker	f490eaeba7	Shuffle optimizer states back and forth between cpu memory during steps	2022-03-04 10:38:51 -07:00
James Betker	3c242403f5	adjust location of pre-optimizer step so I can visualize the new grad norms	2022-03-04 08:56:42 -07:00
James Betker	58019a2ce3	audio diffusion fid updates	2022-03-03 21:53:32 -07:00
James Betker	6873ad6660	Support functionality	2022-03-03 21:52:16 -07:00
James Betker	70fa780edb	Add mechanism to export grad norms	2022-03-01 20:19:52 -07:00
James Betker	db0c3340ac	Implement guidance-free diffusion in eval And a few other fixes	2022-03-01 11:49:36 -07:00
James Betker	2134f06516	Implement conditioning-free diffusion at the eval level	2022-02-27 15:11:42 -07:00
James Betker	ac920798bb	misc	2022-02-27 14:49:11 -07:00
James Betker	f458f5d8f1	abort early if losses reach nan too much, and save the model	2022-02-24 20:55:30 -07:00
James Betker	18dc62453f	Don't step if NaN losses are encountered.	2022-02-24 17:45:08 -07:00
James Betker	7c17c8e674	gurgl	2022-02-23 21:28:24 -07:00
James Betker	81017d9696	put frechet_distance on cuda	2022-02-23 21:21:13 -07:00
James Betker	9a7bbf33df	f	2022-02-23 18:03:38 -07:00
James Betker	b7319ab518	Support vocoder type diffusion in audio_diffusion_fid	2022-02-23 17:25:16 -07:00
James Betker	58f6c9805b	adf	2022-02-22 23:12:58 -07:00
James Betker	03752c1cd6	Report NaN	2022-02-22 23:09:37 -07:00
James Betker	6313a94f96	eval: integrate a n-gram language model into decoding	2022-02-21 19:12:34 -07:00
James Betker	7b12799370	Reformat mel_text_clip for use in eval	2022-02-19 20:37:26 -07:00
James Betker	bcba65c539	DataParallel Fix	2022-02-19 20:36:35 -07:00
James Betker	34001ad765	et	2022-02-18 18:52:33 -07:00
James Betker	a813fbed9c	Update to evaluator	2022-02-17 17:30:33 -07:00
James Betker	79e8f36d30	Convert CLIP models into new folder	2022-02-15 20:53:07 -07:00
James Betker	8f767b8b4f	...	2022-02-15 07:08:17 -07:00
James Betker	29e07913a8	Fix	2022-02-15 06:58:11 -07:00
James Betker	dd585df772	LAMB optimizer	2022-02-15 06:48:13 -07:00
James Betker	2bdb515068	A few mods to make wav2vec2 trainable with DDP on DLAS	2022-02-15 06:28:54 -07:00
James Betker	52b61b9f77	Update scripts and attempt to figure out how UnifiedVoice could be used to produce CTC codes	2022-02-13 20:48:06 -07:00
James Betker	a4f1641eea	Add & refine WER evaluator for w2v	2022-02-13 20:47:29 -07:00
James Betker	e16af944c0	BSO fix	2022-02-12 20:01:04 -07:00
James Betker	15fd60aad3	Allow EMA training to be disabled	2022-02-12 20:00:23 -07:00
James Betker	102142d1eb	f	2022-02-11 11:05:13 -07:00
James Betker	40b08a52d0	dafuk	2022-02-11 11:01:31 -07:00
James Betker	f6a7f12cad	Remove broken evaluator	2022-02-11 11:00:29 -07:00
James Betker	46b97049dc	Fix eval	2022-02-11 10:59:32 -07:00
James Betker	5175b7d91a	training sweeper checkin	2022-02-11 10:46:37 -07:00
James Betker	d1d1ae32a1	audio diffusion frechet distance measurement!	2022-02-10 22:55:46 -07:00
James Betker	23a310b488	Fix BSO	2022-02-10 20:54:51 -07:00
James Betker	1e28e02f98	BSO improvement to make it work with distributed optimizers	2022-02-10 09:53:13 -07:00
James Betker	836eb08afb	Update BSO to use the proper step size	2022-02-10 09:44:15 -07:00
James Betker	3d946356f8	batch_size_optimizer works. sweet! no more tuning batch sizes.	2022-02-09 14:26:23 -07:00
James Betker	18938248e4	Add batch_size_optimizer support	2022-02-08 23:51:31 -07:00
James Betker	de1a1d501a	Move audio injectors into their own file	2022-02-03 21:42:37 -07:00
James Betker	fbea6e8eac	Adjustments to diffusion networks	2022-01-30 16:14:06 -07:00
James Betker	798ed7730a	i like wasting time	2022-01-24 18:12:08 -07:00
James Betker	fc09cff4b3	angry	2022-01-24 18:09:29 -07:00
James Betker	cc0d9f7216	Fix	2022-01-24 18:05:45 -07:00
James Betker	3a9e3a9db3	consolidate state	2022-01-24 17:59:31 -07:00
James Betker	dfef34ba39	Load ema to cpu memory if specified	2022-01-24 15:08:29 -07:00
James Betker	49edffb6ad	Revise device mapping	2022-01-24 15:08:13 -07:00
James Betker	33511243d5	load model state dicts into the correct device it's not clear to me that this will make a huge difference, but it's a good idea anyways	2022-01-24 14:40:09 -07:00
James Betker	3e16c509f6	Misc fixes	2022-01-24 14:31:43 -07:00
James Betker	e420df479f	Allow steps to specify which state keys to carry forward (reducing memory utilization)	2022-01-24 11:01:27 -07:00
James Betker	62475005e4	Sort data items in descending order, which I suspect will improve performance because we will hit GC less	2022-01-23 19:05:32 -07:00
James Betker	8f48848f91	misc	2022-01-22 08:23:29 -07:00
James Betker	ce929a6b3f	Allow grad scaler to be enabled even in fp32 mode	2022-01-21 23:13:24 -07:00
James Betker	bcd8cc51e1	Enable collated data for diffusion purposes	2022-01-19 00:35:08 -07:00
James Betker	894d245062	More zero_grad fixes	2022-01-08 20:31:19 -07:00
James Betker	2a9a25e6e7	Fix likely defective nan grad recovery	2022-01-08 18:24:58 -07:00
James Betker	65ffe38fce	misc	2022-01-06 22:16:17 -07:00
James Betker	f4484fd155	Add "dataset_debugger" support This allows the datasets themselves compile statistics and report them via tensorboard and wandb.	2022-01-06 12:38:20 -07:00
James Betker	b12f47b36d	Add some noise to voice_voice_clip	2021-12-29 13:56:30 -07:00
James Betker	64cb4a92db	Support adamw_zero	2021-12-25 21:32:01 -07:00
James Betker	776a7abfcc	Support torch DDP _set_static_graph	2021-12-25 21:20:06 -07:00
James Betker	62c8ed9a29	move speech utils	2021-12-16 20:47:37 -07:00
James Betker	e7957e4897	Make loss accumulator for logs accumulate better	2021-12-12 22:23:17 -07:00
James Betker	76f86c0e47	gaussian_diffusion: support fp16	2021-12-12 19:52:21 -07:00
James Betker	aa7cfd1edf	Add support for mel norms across the channel dim	2021-12-12 19:52:08 -07:00
James Betker	63bf135b93	Support norms	2021-12-11 08:30:49 -07:00
James Betker	5a664aa56e	misc	2021-12-11 08:17:26 -07:00
James Betker	306274245b	Also do dynamic range compression across mel	2021-12-10 20:06:24 -07:00
James Betker	faf55684b8	Use slaney norm in the mel filterbank computation	2021-12-10 20:04:52 -07:00

1 2 3 4 5 ...

372 Commits