Minggu, 28 Oktober 2012

Browsing Audio Data & speech Recognation


BROWSING AUDIO DATA

Sebuah metode browsing jaringan disediakan untuk browsing video / audio data yang ditembak oleh sebuah IP kamera. Jaringan video / audio metode browsing sesuai mencakup langkah-langkah dari:
  • Menjalankan sebuah program aplikasi komputer lokal untuk mendapatkan kode identifikasi yang disimpan dalam kamera IP,
  •  Transmisi untuk mendaftarkan kode identifikasi ke DDNS ( Dynamic Domain Name Server) oleh program aplikasi,
  • Mendapatkan kamera IP pribadi alamat dan alamat server pribadi sehingga pasangan IP kamera dan kontrol kamera IP melalui kamera IP pribadi alamat dan alamat server pribadi dan,
  • Kopel ke layanan server melalui alamat server pribadi sehingga untuk mendapatkan video / audio data yang ditembak oleh kamera IP, di mana server layanan menangkap video / audio data yang ditembak oleh kamera IP melalui Internet.
 Pada perkembangan sejarahnya Audio mengalami 4 fase, yaitu :
  1. Fase pertama, dikenal juga dengan Tehnik Audio – Mono ini umumnya dikenal sekitar periode tahun 20’an hingga sekitar akhir tahun 50’an dengan diketemukannya Alat Gramaphone oleh Thomas Alfa Edison dengan metode Plat Baja,
  2. Fase kedua, sekitar awal tahun 50’an dengan diketemukan Perekaman Analog dengan piringan plat hitam maka orang mulai mengenal perekaman Mono stereo dengan metode pemisahan suara ( Vokal dan Alat Musik ) menjadi L / R ( Music ;Left – output, Voice ; Right – output ) 
  3. Fase ketiga, ditemukan tehnik Mixing Stereo menjadi L /R , ini populer sekali dan dikembangkan terus hingga sekitar tahun 60’an akhir – awal 70’an
  4. Fase keempat, Proses perekaman Umumnya saat ini didalam produksi audio umumnya dilakukan dari Analog Ke Digital begitupun sebaliknya . Data Analog mempunyai pengertian adalah data sinyal gelombang suara yang dikeluarkan dari Sumber Aslinya hasil perekaman, misal : Perekaman Vokal ke komputer. Data Analog sendiri mempunyai pengertian adalah Informasi gelombang suara yang terus menerus berubah tidak beraturan secara Alami, Data Analog mengalami perubahan keras (Amplitudo) dan tinggi rendah suara yang berfluktuasi, namun belum mempunyai Skala & satuan yang pasti, sedangkan Data Digital adalah hasil manipulasi Informasi gelombang suara secara terus menerus berubah tidak beraturan secara alami menjadi satuan skala yang pasti.
SPEECH RECOGNITION
Speech recognation (ASR) adalah suatu pengembangan teknik dan sistem yang memungkinkan komputer untuk menerima masukan berupa kata yang diucapkan. Teknologi ini memungkinkan suatu perangkat untuk mengenali dan memahami kata-kata yang diucapkan dengan cara digitalisasi kata dan mencocokkan sinyal digital tersebut dengan suatu pola tertentu yang tersimpan dalam suatu perangkat.

Pengenalan ucapan (speech recognation) dalam perkembangan teknologinya merupakan bagian dari pengenalan suara (proses identifikasi seseorang berdasarkan suaranya). Pengenalan suara sendiri terbagi menjadi dua kategori, yaitu:
  • Piranti pengenalan kata (word recognation) yang mampu merespon ucapan-ucapan secara indovidu atau perintah-perintah yang menggunakan teknik yang dikenal sebagai speaker verification. Pertama kali sistem akan membangkitkan suatu template untuk mengenali suara user.
  • Piranti pengenalan kalimat (speech recognation) yang mampu mengenali hubungan antar kata terucap di dalam kalimat atau frase. Teknik -  teknik statistik dipakai dalam hal pola perekaman suara yang akan dicocokkan dengan kata-kata terucap.

Jenis-Jenis Pengenalan Ucapan

Berdasarkan kemampuan dalam mengenal kata yang diucapkan, terdapat 5 jenis pengenalan kata, yaitu :
  • Kata-kata yang terisolasi : Proses pengidentifikasian kata yang hanya dapat mengenal kata yang diucapkan jika kata tersebut memiliki jeda waktu pengucapan antar kata
  • Kata-kata yang berhubungan : Proses pengidentifikasian kata yang mirip dengan kata-kata terisolasi, namun membutuhkan jeda waktu pengucapan antar kata yang lebih singkat
  • Kata-kata yang berkelanjutan :  Proses pengidentifikasian kata yang sudah lebih maju karena dapat mengenal kata-kata yang diucapkan secara berkesinambungan dengan jeda waktu yang sangat sedikit atau tanpa jeda waktu. Proses pengenalan suara ini sangat rumit karena membutuhkan metode khusus untuk membedakan kata-kata yang diucapkan tanpa jeda waktu. Pengguna perangkat ini dapat mengucapkan kata-kata secara natural
  • Kata-kata spontan: Proses pengidentifikasian kata yang dapat mengenal kata-kata yang diucapkan secara spontan tanpa jeda waktu antar kata
  • Verifikasi atau identifikasi suara: Proses pengidentifikasian kata yang tidak hanya mampu mengenal kata, namun juga mengidentifikasi siapa yang berbicara
 Prinsip Dasar Speech Recognation
Semua metode dasar proses pengenalan suara terdiri dari dua fase operasi, yaitu:
  • Proses training. Pada proses ini sistem belajar dari referensi pola yang berupa perbedaan pola sinyal suara misal frase, kata, fonem yang akan mengisi vocabulari dari sistem. Setiap referensi di pelajari dari kata yang dikatakan yang kemudian disimpan dalam template dan telah mengalami metode untuk merata-rata dan karakteristik statistik dan parameter statistik.
  • Proses recognation. Pada proses ini sistem akan diberikan inputan yang belum diketahui dan akan di identifikasi berdasarkan pola template yang telah didapatkan pada proses training.
Pada umumnya, suatu sistem pengenalan suara terdiri dari beberapa modul utama, yaitu:
  • Signal processign frontend digunakan untuk mengkonversi sinyal suara kedalam bentuk sequence feature  vector yang akan digunakan pada saat klasifikasi.
  • Accoustic modelling digunakan untuk memodelkan secara statistik hasil training yang telah dilakukan kedalam sebuah template.
  • Language modelling digunakan untuk memodelkan bentuk kata baik berupa kata, fonem, ataupun kalimat.

Sumber:


Computer Vision & Middleware Telematika

Computer Vision adalah ilmu dan teknologi mesin yang melihat, di mana mesin mampu mengekstrak informasi dari gambar yang diperlukan untuk menyelesaikan tugas tertentu. Sebagai suatu disiplin ilmu, visi komputer berkaitan dengan teori di balik sistem buatan bahwa ekstrak informasi dari gambar. Data gambar dapat mengambil banyak bentuk, seperti urutan video, pandangan dari beberapa kamera, atau data multi-dimensi dari scanner medis. Sedangkan sebagai disiplin teknologi, computer vision berusaha untuk menerapkan teori dan model untuk pembangunan sistem computer vision.

Computer Vision didefinisikan sebagai salah satu cabang ilmu pengetahuan yang mempelajari bagaimana komputer dapat mengenali obyek yang diamati. Cabang ilmu ini bersama Artificial Intelligence akan mampu menghasilkanVisual Intelligence System. Perbedaannya adalah Computer Vision lebih mempelajari bagaimana komputer dapat mengenali obyek yang diamati. Namun komputer grafik lebih ke arah pemanipulasian gambar (visual) secara digital. Bentuk sederhana dari grafik komputer adalah grafik komputer 2D yang kemudian berkembang menjadi grafik komputer 3D, pemrosesan citra, dan pengenalan pola. Grafik komputer sering dikenal dengan istilah visualisasi data.

Computer Vision adalah kombinasi antara :
  • Pengolahan Citra (Image Processing), bidang yang berhubungan dengan proses transformasi citra/gambar (image). Proses ini bertujuan untuk mendapatkan kualitas citra yang lebih baik.
  • Pengenalan Pola (Pattern Recognition), bidang ini berhubungan dengan proses identifikasi obyek pada citra atau interpretasi citra. Proses ini bertujuan untuk mengekstrak informasi/pesan yang disampaikan oleh gambar/citra.

Fungsi / Proses pada Computer Vision
Untuk menunjang tugas Computer Vision, terdapat beberapa fungsi pendukung ke dalam sistem ini, yaitu :
  1. Proses penangkapan citra (Image Acquisition)
  • Image Acqusition pada manusia dimulai dengan mata, kemudian informasi visual diterjemahkan ke dalam suatu format yang kemudian dapat dimanipulasi oleh otak.
  • Senada dengan proses di atas, computer vision membutuhkan sebuah mata untuk menangkap sebuah sinyal visual.
  • Umumnya mata pada computer vision adalah sebuah kamera video.
  • Kamera menerjemahkan sebuah scene atau image.
  • Keluaran dari kamera adalah berupa sinyal analog, dimana frekuensi dan amplitudonya (frekuensi berhubungan dengan jumlah sinyal dalam satu detik, sedangkan amplitudo berkaitan dengan tingginya sinyal listrik yang dihasilkan) merepresentasikan detail ketajaman (brightness) pada scene.
  • Kamera mengamati sebuah kejadian pada satu jalur dalam satu waktu, memindainya dan membaginyamenjadi ratusan garis horizontal yang sama.
  • Tiap‐tiap garis membuat sebuah sinyal analog yang amplitudonya menjelaskan perubahan brightness sepanjang garis sinyal tersebut.
  • Kemudian sinyal listrik ini diubah menjadi bilangan biner yang akan digunakan oleh komputer untuk pemrosesan.
  • Karena komputer tidak bekerja dengan sinyal analog, maka sebuah analog‐to‐digital converter (ADC), dibutuhkan untuk memproses semua sinyal tersebut oleh komputer.
  • ADC ini akan mengubah sinyal analog yang direpresentasikan dalam bentuk informasi sinyal tunggal ke dalam sebuah aliran (stream) sejumlah bilangan biner.
  • Bilangan biner ini kemudian disimpan di dalam memori dan akan menjadi data raw yang akan diproses
    2.  Proses pengolahan citra (Image Processing)
  • Tahapan berikutnya computer vision akan melibatkan sejumlah manipulasi utama (initial manipulation) dari data binary tersebut.
  • Image processing membantu peningkatan dan perbaikan kualitas image, sehingga dapat dianalisa dan di olah lebih jauh secara lebih efisien.
  • Image processing akan meningkatkan perbandingan sinyal terhadap noise (signal‐to‐noise ratio = s/n).
  • Sinyal‐sinyal tersebut adalah informasi yang akan merepresentasikan objek yang ada dalam image.
  • Sedangkan noise adalah segala bentuk interferensi, kekurangpengaburan, yang terjadi pada sebuah objek.
   3.  Analisa data citra (Image Analysis)
  • Image analysis akan mengeksplorasi scene ke dalam bentuk karateristik utama dari objek melalui suatu proses investigasi.
  • Sebuah program komputer akan mulai melihat melalui bilangan biner yang merepresentasikan informasi visual untuk mengidentifikasi fitur‐fitur spesifik dan karekteristiknya.
  • Lebih khusus lagi program image analysis digunakan untuk mencari tepi dan batas‐batasan objek dalam image.
  • Sebuah tepian (edge) terbentuk antara objek dan latar belakangnya atau antara dua objek yang spesifik.
  • Tepi ini akan terdeteksi sebagai akibat dari perbedaan level brightness pada sisi yang berbeda dengan salah satu batasnya.
    4. Proses pemahaman data citra (Image Understanding)
  • Ini adalah langkah terakhir dalam proses computer vision, yang mana sprsifik objek dan hubungannya diidentifikasi.
  • Pada bagian ini akan melibatkan kajian tentang teknik-teknik artificial intelligent.
  • Understanding berkaitan dengan template matching yang ada dalam sebuah scene.
  • Metoda ini menggunakan program pencarian (search program) dan teknik penyesuaian pola (pattern matching techniques).
Contoh aplikasi dari Computer Vision
Beberapa aplikasi yang dihasilkan dari Computer Vision antara lain :

1. Psychology, AI – exploring representation and computation in natural vision
2. Optical Character Recognition – text reading
3. Remote Sensing – land use and environmental monitoring
4. Medical Image Analysis – measurement and interpretation of many types of images
5. Industrial Inspection – measurement, fault checking, process control
6. Robotic – navigation and control

MIDDLEWARE TELEMATIKA 
Middleware merupakan software yang berfungsi sebagai lapisan konversi atau penerjemah. Middleware didefinisikan sebagai sebuah aplikasi yang secara logic berada diantara lapisan aplikasi (application layer) dan lapisan data dari sebuah arsitektur layer-layer TCP/IP. Middleware bisa juga disebut protokol. Protokol komunikasi middleware mendukung layanan komunikasi aras tinggi.

Ada tiga tipe layanan yaitu :

1. Layanan Sistem Terdistribusi,
a. Komunikasi kritis, program-to-program, dan layanan manajemen data.
b. RPC, MOM (Message Oriented Middleware) dan ORB.

2. Layanan Application,
a. Akses ke layanan terdistribusi dan jaringan
b. Yang termasuk : TP (transaction processing) monitor dan layanan database, seperti Structured Query Language (SQL).

3. Layanan Manajemen Middleware, Memungkinkan aplikasi dan fungsi dimonitor secara terus menerus untuk menyakinkan unjuk kerja yang optimal pada lingkungan terdistribusi. 
 
Sumber:
http://eziekim.wordpress.com/2011/11/23/computer-vision/ 
http://saprida.blogspot.com/2011/11/middleware-telematika.html

Tangible User Interface


Tangible User Interface (TUI) adalah sebuah antarmuka pengguna di mana orang berinteraksi dengan informasi digital melalui lingkungan fisik. Nama awal Graspable User Interface, yang tidak lagi digunakan. Salah satu pelopor dalam antarmuka pengguna nyata adalah Hiroshi Ishii, seorang profesor di MIT Media Laboratory yang mengepalai Berwujud Media Group. Pada visi-Nya nyata UIS, disebut Berwujud Bits, adalah memberikan bentuk fisik ke informasi digital, membuat bit secara langsung dimanipulasi dan terlihat. Bit nyata mengejar seamless coupling antara dua dunia yang sangat berbeda dari bit dan atom.
Karakteristik Berwujud User Interfaces
1.      Representasi fisik digabungkan untuk mendasari komputasi informasi digital.
2.      Representasi fisik mewujudkan mekanisme kontrol interaktif.
3.      Representasi fisik perseptual digabungkan untuk secara aktif ditengahi representasi digital.
4.      Keadaan fisik terlihat “mewujudkan aspek kunci dari negara digital dari sebuah sistem.

Contoh :
Sebuah contoh nyata adalah Marmer UI Answering Machine oleh Durrell Uskup (1992). Sebuah kelereng mewakili satu pesan yang ditinggalkan di mesin penjawab. Menjatuhkan marmer ke piring diputar kembali pesan atau panggilan terkait kembali pemanggil. Contoh lain adalah sistem Topobo. Balok-balok dalam LEGO Topobo seperti blok yang dapat bentak bersama, tetapi juga dapat bergerak sendiri menggunakan komponen bermotor. Seseorang bisa mendorong, menarik, dan memutar blok tersebut, dan blok dapat menghafal gerakan-gerakan ini dan replay mereka.
Pelaksanaan lain memungkinkan pengguna untuk membuat sketsa gambar di atas meja sistem dengan pena yang benar-benar nyata. Menggunakan gerakan tangan, pengguna dapat mengkloning gambar dan peregangan dalam sumbu X dan Y akan hanya sebagai salah satu program dalam cat. Sistem ini akan mengintegrasikan kamera video dengan gerakan sistem pengakuan. Contoh lain adalah logat, pelaksanaan TUI membantu membuat produk ini lebih mudah diakses oleh pengguna tua produk. ‘teman’ lewat juga dapat digunakan untuk mengaktifkan interaksi yang berbeda dengan produk.
Beberapa pendekatan telah dilakukan untuk membangun middleware untuk TUI generik. Mereka sasaran menuju kemerdekaan aplikasi domain serta fleksibilitas dalam hal teknologi sensor yang digunakan. Sebagai contoh, Siftables menyediakan sebuah platform aplikasi yang sensitif menampilkan gerakan kecil bertindak bersama-sama untuk membentuk antarmuka manusia-komputer. Dukungan kerjasama TUIs harus mengizinkan distribusi spasial, kegiatan asynchronous, dan modifikasi yang dinamis, TUI infrastruktur, untuk nama yang paling menonjol. Pendekatan ini menyajikan suatu kerangka kerja yang didasarkan pada konsep ruang tupel LINDA untuk memenuhi persyaratan ini. Kerangka kerja yang dilaksanakan TUI untuk menyebarkan teknologi sensor pada semua jenis aplikasi dan aktuator dalam lingkungan terdistribusi.
Sumber:


Head Up Display (HUD) System


Head Up Display (HUD) adalah tampilan transparan yang menyajikan data tanpa mengharuskan pengguna melihat dari sudut pandang yang biasa mereka lihat. Asal usul nama berasal dari pilot yang dapat melihat informasi dengan kepala tegak dan melihat ke depan, bukannya menghadap ke bawah melihat instrumen yang lebih rendah. Sebuah contoh awal dari apa yang sekarang akan disebut sebagai head up display adalah sistem Proyektor dari Angkatan udara Inggris Mrk radar VIII intersepsi dipasang ke beberapa pejuang Havilland, di mana layar radar diproyeksikan ke kaca depan pesawat bersama dengan buatan cakrawala, memungkinkan pilot untuk melakukan interceptions tanpa mengalihkan mata mereka dari kaca depan.

Meskipun mereka pada awalnya dikembangkan untuk penerbangan militer, HUDs sekarang digunakan dalam handphone, mobil, dan aplikasi lainnya.

Seperti halnya General Motors yang mulai mengembangkan Head Up Display berteknologi Laser. Dengan inovasi ini pengemudi tak akan lagi menemukan kendala penglihatan pada kondisi gelap, hujan bahkan berkabut sekali pun.

Inovasi yang menurut GM tak akan lama lagi diproduksi ini, memiliki dampak besar pada keselamatan karena mampu  memandu pengemudi saat berada di jalan bahkan dalam kondisi hampir mustahil untuk melihat dengan mata telanjang.

Hal ini dimungkinkan berkat penggunaan sensor dan kamera yang mengumpulkan informasi untuk diproyeksikan ke kaca depan menggunakan laser ultra violet kecil.

Teknologi ini merupakan bagian dari kerjasama antara depertemen riset dan pengembangan (R&D) GM dengan tim di University of Southern California dan Carnegie Mellon University.

"Saat mengemudi dalam kabut, kita bisa memanfaatkan kamera infra merah pada kendaraan untuk mengetahui di mana keberadaan tepi jalan dan laser dapat 'melukiskan' tepi jalan tersebut pada kaca depan sehingga pengemudi bisa mengetahuinya," ujar manajer grup laboratorium GM R&D Thomas Seder.

Proyek berikutnya nanti, tim akan menggabungkan sistem ini dengan fitur navigasi, night vision, dan menambah lagi teknologi sensor berbasis kamera untuk membantu pengemudi tetap melihat jalan.

Teknologi ini memggunakan lapisan fospor transparan khusus yang ditanam pada kaca depan. Lapisan ini akan berpendar ketika terkena sorotan sinar laser ultra violet yang menampilkan bentuk tikungan jalan di depan. Dengan teknologi seperti itu, memungkinkan seluruh permukaan kaca depan berfungsi sebagai layar display.

Hal ini juga memungkinkan kaca depan dapat memproyeksikan adanya berbagai rintangan lain yang terdeteksi sensor namun di luar jangkauan pendangan normal, seperi hewan maupun pejalan kaki di tepi jalan.
Fitur lain dari teknologi yang dinamai GM HUD (Head Up Display) System ini adalah kemampuannya dalam mendeteksi dan membaca rambu-rambu jalan seperti teknologi OpelEye system. Fitur ini sangat berguna bagi pengemudi untuk mengetahui batas kecepatan yang diijinkan serta tanda-tanda peringatan lainnya.

Sistem ini juga berpotensi menjadi sistem navigasi dengan cara membaca dan menafsirkan tanda-tanda lalu lintas dan menggabungkan dengan instruksi rute untuk mengingatkan pengemudi di mana dan kapan harus berbelok yang benar.

Saat pihak GM menyatakan 'tak lama lagi akan diproduksi', sepertinya tak akan secepat membalikkan telapak tangan. Diperkirakan teknologi ini baru bisa diproduksi antara 4-5 tahun ke depan.

General Motors mulai menggunakan display head-up pada tahun 1988 dengan layar warna pertama muncul pada tahun 2001 pada Corvette. Pada tahun 2003, BMW menjadi produsen Eropa pertama yang menawarkan HUDs. Menampilkan menjadi semakin tersedia dalam mobil produksi, dan biasanya menawarkan speedometer, tachometer, dan menampilkan sistem navigasi. HUD juga ditampilkan di General Motors tertentu, Honda, Toyota dan kendaraan Lexus. Manufaktur lainnya seperti Citroen, Saab, dan Nissan saat ini menawarkan beberapa bentuk sistem HUD. HUDs Sepeda Motor helm juga tersedia secara komersial.


sumber: