Oxford Wave Research

Vocalise

VOCALISE (Voice Comparison and Analysis of the Likelihood of Speech Evidence): software biometric suara yang kuat dan fleksibel untuk melakukan perbandingan speaker yang cepat dan akurat menggunakan Deep Neural Networks.

Vocalise (Voice Comparison and Analysis of the Likelihood of Speech Evidence) adalah solusi software voice biometrics yang kuat dan fleksibel untuk melakukan perbandingan cepat dan akurat dari pembicara menggunakan x-vectors berbasis Deep Neural Network (DNN)

Bekerja menggunakan framework state-of-the-art x-vector PLDA (Probabilistic Linear Discriminant Analysis)
Fitur visualisasi yang powerful untuk pendekatan i-vector dan x-vector : melihat titik 3D dari pembicara cloud yang interaktif
Adaptasi kondisi untuk “tuning” i-vector atau x-vector sistem PLDA untuk kondisi rekaman tertentu
Kalibrasi skor untuk memungkinkan interpretasi dari perbandingan skor pada kondisi-kondisi berbeda
Disediakan software Bio-Metrics memungkinkan penilaian performa lewat tingkat error rates, Tippett plots, DET curves, dan analisis Zoo plit, dan penghitungan rasio di bawah hipotesis pembicara yang sama dan pembicara yang berbeda

Vocalise merupakan solusi forensik digital yang membutuhkan analisis biometrik suara.

Algoritme Canggih

Vocalise mendukung beberapa generasi dari teknologi speaker recognition otomatis, dari pendekatan klasik berbasis Gaussian Mixture Models (GMMs), hingga i-vectors dan x-vectors yang canggih. Selama evolusi teknologi ini, kerumitan dari sistem telah bertambah, begitu juga dengan performa recognition.

Deep Neural Networks (DNNs) menandai fase baru di evolusi dari teknologi speaker recognition otomatis, menyediakan fitur highly-discriminative speaker-specific dari rekaman pembicaraan. Vocalise melanjutkan dukungan baik legacy dan algoritme speaker modelling yang canggih, yaitu framework ‘x-vector’ berbasis DNN.

Aristektur ‘Open-box’

Vocalise dikembangkan dengan arsitektur ‘open-box’. Ide yang mendasari desainnya adalah user seharusnya dapat mengubah parameter sistem dan mengenalkan data baru pada tiap Langkah dari proses speaker recognition. Dengan pendekatan ini, user tidak dibatasi model atau konfigurasi yang disediakan manufaktur, dan memiliki kemampuan untuk melatih sistem secara khusus untuk area permasalahan mereka. Selain itu, Vocalise berinteraksi dengan program terpercaya seperti Praat untuk memungkinkan user memanfaatkan fitur yang disediakan oleh software spesialis.

Opsi Fitur Ekstraksi Speaker yang Fleksibel

Fitur Spektral

Fitur Spektral adalah descriptor dari karakteristik frekuensi yang secara otomatis diekstrak dari sampel pembicaraan dalam waktu singkat, dan paling umum digunakan pada speech speaker recognition. Vocalise sekarang mendukung Mel-frequency cepstral coefficient (MFCC) fleksibel.

Fitur Fonetik Otomatis

Penggunaan fitur fonetik otomatis, seperti fitur fonetik yang diekstrak dengan cara otomatis, sekarang didukung lewat interface dengan Praat.

Fitur yang Disediakan Pengguna

Fitur yang disediakan pengguna mengacu pada opsi bagi user untuk menyediakan fitur sendiri ke sistem di mode GMM dan GMM-MAP.

Fitur-Fitur Tingkat Lanjut

Tayang ulang dan visualisasi
Drag-and-drop
Teroptimasi untuk berjalan di mesin multi-processor
Sesi siap untuk digunakan
Mode switching
Voice Activity Detection (VAD)
Kemampuan unik menggunakan fitur yang digunakan secara tradisional pada analisis phonetic acoustic forensik digital
Konfigurabilitas lanjut dari MFCC dan turunannya
Menerapkan teknik speaker recognition otomatis pada fitur fonetik
Presentasi hasil
Skor keluaran eskpor

Dengan Vocalise, mempermudah analisis Anda dalam forensik digital yang melibatkan suara.

Tertarik dengan produk ini?

Fitur-fitur Vocalise:

Klik pada gambar untuk memperbesar