掌握▪新創動態
《國際要聞》Envision推出視障者AI眼鏡 可將文本圖像轉為60國語言音頻
2022-03-28


※Envision Glasses 是一款可穿戴式設備,可顯著改善盲人和視障人士的日常生活。它提供了最直觀、最簡單的方式來訪問他們周圍各種視覺資訊。(圖片來源:Envision)

配備鏡頭並由AI驅動的Envision眼鏡可以捕捉文本圖像,並將其轉化為音頻,可識別熟悉的臉孔,並可幫助用戶在室內和室外進行導航。

這可能是閱讀火車站的標誌、列印的文件或茶葉袋背面的文字。 在社交環境中,它們可能有助於識別熟悉的臉孔。 在一個新的地方,一個人可以大聲描述他們周圍的環境。

Envision眼鏡配備了一個800萬像素的鏡頭,可以捕捉到每英寸約800萬分方的圖像,並具有寬闊的視野,因此不會錯過任何細節。 這款眼鏡有WiFi和藍牙功能以保持連接,電池壽命約為5至6小時,並有一個內置的USB音頻揚聲器(以及藍牙音頻)。 即使有這麼多硬體,它們仍然很輕,重量不到2盎司,而且該公司一直在忙著增加更多的功能。

本月初,在荷蘭設有辦事處的Envision公司公佈了其智慧型眼鏡的新功能,這些功能包括更強的光學字符識別(OCR),改善了文本閱讀和增加新的識別語言。 Envision增加了印地語、日語、中文和韓語,這些語言可以透過智慧鏡準確捕捉和離線閱讀。 據該公司稱稱,這使得離線時支持的語言總數達到26種,而連接到互聯網時支持的語言數量超過了60種。

Envision公司的聯合創辦人Karthik Kannan說,無論在什麼情況下,由人工智慧輔助科技公司Envision創造的智慧眼鏡都是為了幫助盲人和視力障礙者更好地處理文字,並接受一切。

Kannan在Demo智慧眼鏡的Zoom電話訪問中提及,Envision眼鏡是一種工具,可以幫助視力受損的人進入他們周圍的視覺世界。

他說,無論用戶面前是什麼,“無論是文本、朋友和家人的臉孔,還是物體,它都會獲取視覺資訊,然後將其轉換為音頻”。

為了展示,Kannan 拿著一份文件來展示眼鏡如何鎖定圖像並在上下文中處理文本,識別參數和副標題。例如,這樣做是為了讓人們可以掃描文檔,然後仔細閱讀特定部分。

Kannan指導該眼鏡如何定位物件,使其能夠被捕捉到視野中並被大聲閱讀。 當他有意將文件移出鏡框時,他就會得到指示,如將文件向上或頭向下移動,以幫助他將文件移回視野中。 據該公司稱,無論是閱讀列式的報紙文章、路標還是餐廳菜單,Envision眼鏡都能破譯佈局,使用戶更容易閱讀。

Envision眼鏡目前可與 Google Glass2企業版配合使用,隨著升級,用戶可以更容易地獲得室內和室外導航等專業服務。 這家智慧眼鏡公司現在還允許開發者在其平台上為用戶提供額外的功能。 例如,隨著現金閱讀器應用程式的增加,Envision現在可以識別100多種貨幣的鈔票。

該公司還著眼於使這款新穎、更新的眼鏡更容易為全球20億盲人或視力障礙者所接受,也尋求方法讓眼鏡得到保險給付,這款眼鏡連同配套的Envision應用程式價格為3500美元。

Kannan表示:"在美國我們已經與州政府機構和復健中心合作,全部或部分給付眼鏡的費用,我們還在與美國各地的經銷商合作,以最好的方式幫助客戶以合理的價格獲得這項技術"。

其他公司也為視力障礙者提供智慧型眼鏡。 據該公司稱,一個主要的競爭者OrCam MyEye 2是一個智慧微型可穿戴設備,可以為視力障礙者或盲人大聲朗讀文字。

但是,無論誰在市場上獲勝,或者它是否大到足以支持多個參與者,有一件事是值得肯定的 ,有多一些技術可選擇,幫助視力有限的人獨立生活。

Kannan說,Envision眼鏡可以做到這一點,並確保盲人或視力障礙者不必經常依賴他人。他們用它來識別他們的朋友和家人的臉,甚至用眼鏡進行視訊通話 "世界各地的用戶用它們來閱讀60多種不同語言的信件。

(來源: MedcityNews 生策中心編譯)

本網站中所有資料(包括影音.文字.圖表.數據等) ,均屬於本中心或各該新創企業團隊之專屬財產,如有引用,請確實註明出處來源。 <完整資訊>
財團法人生技醫療科技政策研究中心 版權所有
Copyright © 2012 - 2024 Research Center for Biotechnology and Medicine Policy (RBMP). All Rights Reserved