Oxford Wave Research
Vocalise
VOCALISE (Voice Comparison and Analysis of the Likelihood of Speech Evidence): software biometric suara yang kuat dan fleksibel untuk melakukan perbandingan speaker yang cepat dan akurat menggunakan Deep Neural Networks.
Vocalise (Voice Comparison and Analysis of the Likelihood of Speech Evidence) adalah solusi software voice biometrics yang kuat dan fleksibel untuk melakukan perbandingan cepat dan akurat dari pembicara menggunakan x-vectors berbasis Deep Neural Network (DNN)
- Bekerja menggunakan framework state-of-the-art x-vector PLDA (Probabilistic Linear Discriminant Analysis)
- Fitur visualisasi yang powerful untuk pendekatan i-vector dan x-vector : melihat titik 3D dari pembicara cloud yang interaktif
- Adaptasi kondisi untuk “tuning” i-vector atau x-vector sistem PLDA untuk kondisi rekaman tertentu
- Kalibrasi skor untuk memungkinkan interpretasi dari perbandingan skor pada kondisi-kondisi berbeda
- Disediakan software Bio-Metrics memungkinkan penilaian performa lewat tingkat error rates, Tippett plots, DET curves, dan analisis Zoo plit, dan penghitungan rasio di bawah hipotesis pembicara yang sama dan pembicara yang berbeda
Vocalise merupakan solusi forensik digital yang membutuhkan analisis biometrik suara.
Algoritme Canggih
Vocalise mendukung beberapa generasi dari teknologi speaker recognition otomatis, dari pendekatan klasik berbasis Gaussian Mixture Models (GMMs), hingga i-vectors dan x-vectors yang canggih. Selama evolusi teknologi ini, kerumitan dari sistem telah bertambah, begitu juga dengan performa recognition.
Deep Neural Networks (DNNs) menandai fase baru di evolusi dari teknologi speaker recognition otomatis, menyediakan fitur highly-discriminative speaker-specific dari rekaman pembicaraan. Vocalise melanjutkan dukungan baik legacy dan algoritme speaker modelling yang canggih, yaitu framework ‘x-vector’ berbasis DNN.
Aristektur ‘Open-box’
Vocalise dikembangkan dengan arsitektur ‘open-box’. Ide yang mendasari desainnya adalah user seharusnya dapat mengubah parameter sistem dan mengenalkan data baru pada tiap Langkah dari proses speaker recognition. Dengan pendekatan ini, user tidak dibatasi model atau konfigurasi yang disediakan manufaktur, dan memiliki kemampuan untuk melatih sistem secara khusus untuk area permasalahan mereka. Selain itu, Vocalise berinteraksi dengan program terpercaya seperti Praat untuk memungkinkan user memanfaatkan fitur yang disediakan oleh software spesialis.
Opsi Fitur Ekstraksi Speaker yang Fleksibel
Fitur Spektral
Fitur Spektral adalah descriptor dari karakteristik frekuensi yang secara otomatis diekstrak dari sampel pembicaraan dalam waktu singkat, dan paling umum digunakan pada speech speaker recognition. Vocalise sekarang mendukung Mel-frequency cepstral coefficient (MFCC) fleksibel.
Fitur Fonetik Otomatis
Penggunaan fitur fonetik otomatis, seperti fitur fonetik yang diekstrak dengan cara otomatis, sekarang didukung lewat interface dengan Praat.
Fitur yang Disediakan Pengguna
Fitur yang disediakan pengguna mengacu pada opsi bagi user untuk menyediakan fitur sendiri ke sistem di mode GMM dan GMM-MAP.
Fitur-Fitur Tingkat Lanjut
- Tayang ulang dan visualisasi
- Drag-and-drop
- Teroptimasi untuk berjalan di mesin multi-processor
- Sesi siap untuk digunakan
- Mode switching
- Voice Activity Detection (VAD)
- Kemampuan unik menggunakan fitur yang digunakan secara tradisional pada analisis phonetic acoustic forensik digital
- Konfigurabilitas lanjut dari MFCC dan turunannya
- Menerapkan teknik speaker recognition otomatis pada fitur fonetik
- Presentasi hasil
- Skor keluaran eskpor
Dengan Vocalise, mempermudah analisis Anda dalam forensik digital yang melibatkan suara.