Please enable JavaScript.
Coggle requires JavaScript to display documents.
LUẬN VĂN CAO HỌC, VideoCaption TextDescription, Harmonics &…
LUẬN VĂN
CAO HỌC
Phác thảo ý tưởng
What?
How?
Why?
Feature Importance
Xác định đúng phạm vi đề tài
Công cụ cần thiết
libPython?
libJava?
libC
https://github.com/marsyas/marsyas
https://librosa.org/doc/latest/index.html
https://docs.scrapy.org/en/latest/intro/install.html
Crawl data audio
OpenMIC-2018 [Spotify]
https://zenodo.org/record/1432913#.YUWW8HUzafq
https://research.atspotify.com/datasets/
MSD:
https://www.tagtraum.com/msd_genre_datasets.html
https://www.tagtraum.com/learned_ontologies.html
https://www.free-scores.com/download-sheet-music.php?pdf=95882
Đọc các paper trước
Thực hành
https://www.kaggle.com/dapy15/music-genre-classification
https://www.kaggle.com/andradaolteanu/work-w-audio-data-visualise-classify-recommend
https://www.kaggle.com/mistag/extracting-bird-song-signatures-with-wavelets
https://scholar.google.com/citations?user=yPgxxpwAAAAJ&hl=en
FEATURES
Rhythmic content
regularity of the rhythm
regularity of main beat & subbeats
automatic beat detector
Downsampling
Mean Removal
Low-Pass Filtering
Enhanced Autocorrelation
Full Wave Rectification
Peak Detection & Histogram Calculation
Beat Histogram Features
Pitch content
pitch detector
multipitch detection algorithm
how to find main pitches for that
short segment of sound?
MFCC
spectral envelope
short-time features
pitch
amplitude
brightness
bandwidth
Wavelet transform
Fourier Transform
Short time Fourier transform
(STFT)
Giảm chiều dữ liệu
phương pháp PCA
Pyramidal algorithm
Discrete Wavelet transform
(DWT)
https://www.academia.edu/34862488/Ch%C6%B0%C6%A1ng_1_PH%C3%89P_BI%E1%BA%BEN_%C4%90%E1%BB%94I_WAVELET
beat spectrum
spectral_centroid
Timbral texture
Spectrogram
Spectral Flux
Spectral Rolloff
Spectral Centroid
Analysis & Texture Window
Low-Energy Feature
Zero Crossing Rate
Time Domain Zero Crossings
MFCC
https://viblo.asia/p/feature-extraction-mfcc-cho-xu-ly-tieng-noi-4dbZN2xmZYM
https://viblo.asia/p/audio-features-dac-trung-spectral-4P856z3B5Y3
Tempo BMP
Nyquist frequency
http://www.dspguide.com/pdfbook.htm
Virtual Music Teacher for New Music Learners with Optical Music Recognition
https://link.springer.com/chapter/10.1007/978-3-319-20609-7_39
https://docs.google.com/spreadsheets/d/1sDmv8AvqLnRXvoMhAuROBnvaaYASslCgZSM47Rq861s/edit#gid=0
Đọc overview
Các tác giả tham khảo
https://www.researchgate.net/profile/Francois-Pachet
https://slidetodoc.com/timbre-similarity-work-by-aucouturier-pachet-rebecca-fiebrink/
Soạn thảo khung trình bày
Xây dựng mô hình
Xây dựng phép đánh giá
Áp dụng được các phương pháp trực quan/phân tích dữ liệu
LaTex
https://www.cs.cmu.edu/afs/cs/project/anim/ph/463.96/pub/www/notes/fourier/fourier.tex
VideoCaption
TextDescription
nets
vanilla CNN
mobileNets
MaskRCNN
Microsoft COCO: Common Objects in Context
Word Embedding
Frequency-base
tf-idf Vector
Co-ocurrence Matrix
Count Vector
Prediction-base
Word2vec
CBOW
Skip-gram
Multimedia database
I. Tổng quan
Khái niệm
ðặc trưng
Cấu trúc lưu trữ CSDL ĐPT
Cây k-D
cây tứ phân
tứ phân MX
So sánh
Cây R
Ngôn ngữ thao tác
II. Tư liệu đa phương tiện tương tác
CSDL ĐPT
Kiến trúc
Các mô hình dữ liệu
Mô hình hoá
Nén ảnh
Nén JPEG
Hệ màu YUV -> YCbCr
Cosin transform
Phân loại
Mô hình kịch bản
III. Thành tựu & xu hướng
Các thành tựu chính
semantic description & representation
shot detection
2.Các sản phẩm thương mại và mẫu nghiên cứu
Hướng phát triển
IV. Quản trị dữ liệu đa phương tiện
Khái niệm
Kiến trúc
Các kỹ thuật mô hình hóa
Các kĩ thuật chỉ số hoá và trừu tượng hóa
Graph Neuron Network
Explaination
Harmonics & Perceptrual