audio

Here are 2,342 public repositories matching this topic...

huggingface / transformers

🤗 Transformers: the model-definition framework for state-of-the-art machine learning models in text, vision, audio, and multimodal models, for both inference and training.

audio python nlp machine-learning natural-language-processing deep-learning pytorch transformer speech-recognition glm pretrained-models hacktoberfest gemma vlm pytorch-transformers model-hub llm qwen deepseek

Updated Jul 29, 2025
Python

Anjok07 / ultimatevocalremovergui

Star

GUI for a Vocal Remover that uses Deep Neural Networks.

audio music pytorch source spectrogram karaoke instrumental vocal separation vocal-remover vocals kareokee

Updated Mar 13, 2025
Python

AIGC-Audio / AudioGPT

Star

AudioGPT: Understanding and Generating Speech, Music, Sound, and Talking Head

audio music speech sound gpt talking-head

Updated Jul 6, 2024
Python

speechbrain / speechbrain

Star

A PyTorch-based Speech Toolkit

Updated Jul 28, 2025
Python

Uberi / speech_recognition

Star

Speech recognition module for Python, supporting several engines and APIs, online and offline.

audio python speech-recognition speech-to-text

Updated May 18, 2025
Python

openai / jukebox

Star

Code for the paper "Jukebox: A Generative Model for Music"

audio music paper pytorch transformer generative-model vq-vae

Updated Jun 19, 2024
Python

librosa / librosa

Star

Python library for audio and music analysis

audio python music dsp scipy librosa

Updated Jul 29, 2025
Python

smacke / ffsubsync

Sponsor

Star

Automagically synchronize subtitles with video.

Updated Jul 20, 2025
Python

tyiannak / pyAudioAnalysis

Sponsor

Star

Python Audio Analysis Library: Feature Extraction, Classification, Segmentation and Applications

audio python machine-learning signal-processing pyaudioanalysis audio-data audio-analysis-tasks

Updated Mar 28, 2025
Python

metabrainz / picard

Sponsor

Star

Picard is a cross-platform music tagger powered by the MusicBrainz database

audio python music picard musicbrainz id3 tagger musicbrainz-picard music-tagger acoustid

Updated Jul 26, 2025
Python

spotify / basic-pitch

Star

A lightweight yet powerful audio-to-MIDI converter with pitch bend detection

audio python music lightweight machine-learning typescript midi transcription pitch-detection polyphonic

Updated Jan 17, 2025
Python

huggingface / distil-whisper

Star

Distilled variant of Whisper for speech recognition. 6x faster, 50% smaller, within 1% word error rate.

audio speech-recognition whisper

Updated Jan 8, 2025
Python

riffusion / riffusion-hobby

Star

Stable diffusion for real-time music generation

audio music ai diffusion stable-diffusion diffusers

Updated Jul 22, 2024
Python

WyattBlue / auto-editor

Star

Auto-Editor: Efficient media analysis and rendering

audio video python3 audio-editing video-processing automatic video-editing audio-processing

Updated Jul 26, 2025
Python

Rikorose / DeepFilterNet

Star

Noise supression using deep filtering

audio rust deep-learning speech pytorch speech-enhancement noise-suppression

Updated Oct 17, 2024
Python

modelscope / ClearerVoice-Studio

Star

An AI-Powered Speech Processing Toolkit and Open Source SOTA Pretrained Models, Supporting Speech Enhancement, Separation, and Target Speaker Extraction, etc.