GitHub - m-djawadi/SER: The project involves audio feature extraction and sentiment classification using various ML models. Features (ZCR, Chroma_stft, MFCC, RMS, MelSpectrogram) are extracted from audio data. Data augmentation techniques (noise addition, stretching, pitching, shifting) increase data diversity.

m-djawadi / SER Public

Notifications You must be signed in to change notification settings
Fork 0
Star 0

The project involves audio feature extraction and sentiment classification using various ML models. Features (ZCR, Chroma_stft, MFCC, RMS, MelSpectrogram) are extracted from audio data. Data augmentation techniques (noise addition, stretching, pitching, shifting) increase data diversity.

0 stars 0 forks Branches Tags Activity

Star

Notifications

Branches Tags

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
Data Preparation		Data Preparation
Models		Models
README.txt		README.txt

Repository files navigation

The project involves audio feature extraction and sentiment classification using various ML models. Features (ZCR, Chroma_stft, MFCC, RMS, MelSpectrogram) are extracted from audio data. Data augmentation techniques (noise addition, stretching, pitching, shifting) increase data diversity.

Code prepares data by normalization and splitting. Models used: CNN, LSTM, BiLSTM, Wave2Vec. Models capture spatial patterns, temporal dynamics, long-range dependencies. Evaluation metrics assess performance.

Pipeline: audio feature extraction ➡️ data augmentation ➡️ sentiment classification. Final model choice depends on task, dataset, resources. #ML #AudioProcessing #SentimentAnalysis