Microsoft는 시각 장애가 있는 사람들을 위해 시각적 세계를 청각적 경험으로 변환하도록 설계된 iPhone용 앱을 출시했습니다.
Seeing AI는 이미지 인식 및 자연어 처리에 인공 지능을 활용하여 스마트폰의 카메라를 사용하여 사용자 주변에서 일어나는 일을 캡처한 다음 이를 음성으로 전달합니다.
앱이 사람을 가리키면 얼굴 인식 소프트웨어를 사용하여 해당 개인의 성별, 나이 및 감정을 알려줍니다. 거리 표지판이나 문서와 같이 텍스트가 포함된 대상을 조준하면 읽은 대로 말을 합니다.
이 앱은 또한 스캔한 바코드에서 제품 정보를 중계할 수 있으며, 통화를 식별하기 위한 기능(가게에서 현금을 건네줄 때 유용)과 더 넓은 장면을 설명하기 위한 기능이 개발되고 있습니다.
예를 들어, 아래 프로모션에서 사용자는 사진을 찍고 앱에는 공원에서 프리즈비를 던지는 어린 소녀의 이미지라고 나와 있습니다.
이 앱은 Microsoft Research의 작업 결과이며 여러 초점 영역을 깔끔하게 결합한 것으로 보입니다. 연구 동 사이트에는 AI, 컴퓨터 비전 및 인간 언어 기술이 핵심 초점 영역으로 나열되어 있으며 Seeing AI가 세 가지 모두를 선택합니다. 이니셔티브가 진행 중인 다른 프로젝트에는 다음이 포함됩니다. 마인크래프트 기반 AI 테스트 그라운드 신경망을 위한 수단 자신의 소프트웨어 코드 만들기.
AI를 보는 것은 확실히 시각 장애가 있는 사람들에게 유용한 도구가 될 가능성이 있는 것처럼 보이지만, 특히 문서를 스캔하는 데 사용되는 경우 필요한 물체와 카메라를 정렬하기 위해 앱이 어느 정도의 시각 수준이 필요할 것입니다. Alphr에게 말하면서, RNIB(Royal National Institute of Blind People)는 Microsoft 앱이 선보인 기술이 액세스에 “혁명”을 제공할 수 있지만 그 사용은 사용자를 스스로 안내하는 카메라의 기능에 달려 있다고 말했습니다.
RNIB의 수석 전략 관리자인 Robin Spinks는 “인공 지능, 컴퓨터 비전 및 인간 언어 기술은 시각 장애인과 부분 시력을 가진 사람들의 액세스에 혁명을 제공합니다.”라고 말했습니다. “방향과 배치는 컴퓨터 비전의 성공적인 배포를 위한 중요한 요소입니다. 카메라 방향을 알 수 있으면 잘 할 수 있지만 실제 트릭은 유용한 시력이 없는 사람도 동등하게 혜택을 받을 수 있도록 카메라가 자체 방향을 지정하는 것입니다.
“RNIB는 이러한 기술의 잠재력을 활용하기 위해 전 세계의 우량 기업과 협력하고 있으며 Seeing AI의 등장을 열렬히 환영합니다.”
미국, 캐나다, 홍콩, 인도, 뉴질랜드, 싱가폴에 거주하시는 분들은 지금 iOS 앱영국 사용자는 사용할 수 있게 될 때까지 기다려야 합니다.