jueves, 18 de septiembre de 2008

Escritura mediante señales electrooculográficas

Nahuel Matías Dalgaard (*) Esteban Lucio Gonzalez (**) Juan Carlos Tulli (***)
Pablo Daniel Agüero (****)

Universidad Nacional de Mar del Plata, Facultad de Ingeniería, Argentina

(*)dalgaard@uolsinectis.com.ar, (**)elgonzal@fi.mdp.edu.ar, (***) jctulli@fi.mdp.edu.ar, (****)pdaguero@fi.mdp.edu.ar

ABSTRACT
In this work, we describe the development of a system that gives an alternate and economical way of acceding a computer using eyes motion. In turn, this access system (hardware and software) allows writing of text in a virtual keyboard in the monitor of a PC by looking at the command or character to write. This will allow disabled people to use the computer as a communication tool. Because of that, the project was limited as a device that allows writing and pronouncing short sentences.

RESUMEN

Este trabajo, describe el desarrollo de un sistema que por medio de señales oculográficas brinda una alternativa económica a los dispositivos de acceso a computadoras. Hardware y software permiten la escritura de textos en un teclado virtual mostrado en el monitor de una computadora simplemente mirando los comandos o letras a escribir. Esto facilitará a usuarios con discapacidades motrices severas usar la computadora como medio para comunicación, por lo que el proyecto se acotó a un sistema que permite escribir frases cortas y pronunciarlas.

KEYWORDS
Discapacidad, Oculografía, Control, Escritura.

INTRODUCCIÓN

Así como una rampa o elevador provee a una persona que usa silla de ruedas el acceso a diferentes espacios físicos, la tecnología adaptativa, mediante software y hardware especializado, permite a personas con discapacidades motrices usar computadoras.

Las discapacidades motrices pueden ser causa de diferentes patologías tales como: distrofia muscular, parálisis cerebral, lesiones en la espina dorsal, o esclerosis múltiple. Las discapacidades citadas suelen impedir la comunicación oral debido a los problemas que las personas en cuestión poseen para controlar fiablemente sus músculos, esto motivó el desarrollo de diferentes sistemas de adaptación para ser utilizados como comunicador, algunos de ellos basados en computadoras (PC o computadora personal). Pero está posibilidad, a su vez, generó un nuevo problema que es el acceso del usuario a la PC. Uno de los métodos para acceder a una PC de manera no convencional (teclado o ratón), es a través de la utilización de Técnicas Electrooculográficas.

COMUNICADOR ELECTROOCULOGRÁFICO.

El “Comunicador Electrooculográfico” es un dispositivo compuesto por un puntero (o rastro electrónico que aparece en la pantalla de la PC) que obedece al movimiento de los globos oculares. Esto, junto con un software especialmente diseñado, permite que personas con dificultades motrices se comuniquen en forma oral y/o escrita. Este dispositivo incluye un sintetizador de voz en idioma castellano, lo que permite expresar el mensaje en forma oral.

La utilización de Señales Electrooculográficas (EOG) como fuente de comandos es fiable, ya que a pesar de ser propensa a fuertes perturbaciones, mediante un adecuado tratamiento, es posible conseguir una relación unívoca entre la posición del ojo dentro de su cuenca y una zona en la pantalla o monitor de PC [1].

Existen actualmente muchos sistemas con esta finalidad, algunos ejemplos de ello son: Point! ™, OptiTrack™, Head Master Plus, los cuales basan su funcionamiento en el seguimiento de la cabeza, por medio de una cámara de video. Otros, mas complejos, como: Vision-Trak™ funcionan utilizando técnicas de seguimiento de pupila. Todas estas interfases alcanzan gran precisión y son transparentes a los programas en entorno Windows, pero a pesar de sus virtudes, sus costos los hacen poco accesibles para el usuario promedio en Argentina, y es aquí donde la técnica propuesta se hace atractiva para países en vías de desarrollo [2].

Señales EOG

En la Fig. 1 se ve el posicionamiento de electrodos sobre un voluntario. La foto tomada de [2], fue obtenida en una sesión de medición de señales electrooculográficas (EOG) y electromiográficas (EMG ).

Al ser la señal EOG una indicación de la posición de los ojos relativa a la cabeza, al mover la cabeza manteniendo la mirada fija en un punto, también provoca variaciones de este potencial, por lo que cualquier sistema de control que use estas señales deberá tener en cuenta esta eventualidad. En la Fig. 2 se muestra el registro de dos señales EOG y EMG adquiridas simultáneamente. La señal EOG es la responsable de los escalones de tensión ocurridos aproximadamente cada 30 segundos. Estos escalones de tensión obedecen a movimientos voluntarios de los ojos fijando la vista en distintos puntos del monitor de la computadora, debido a la posición de los electrodos (Fig. 1) se registró el movimiento vertical. La amplitud aproximada de los escalones de tensión es de 0.3 V. Dado que se usó una ganancia de 1000 veces en el amplificador adquisidor, esto implica que se midió a nivel electrodo una tensión de 300µV.



Figura 1. Ubicación de los electrodos

Las señales EMG o de movimiento de párpados son las responsables por los picos (o deltas) de amplitud, los cuales obedecen tanto a movimientos voluntarios de los párpados como involuntarios. En este sentido, los picos altos y anchos producidos a los 160 segundos y a los 206 segundos se deben a un movimiento voluntario de párpados cerrados fuertemente (o sea ejerciendo fuerza adicional sobre los mismos). Esto se hizo para estudiar la posibilidad de usar estos movimientos como señales de control o validación



Figura 2. Registro de señales EOG

La señal obtenida de los electrodos presenta un nivel de tensión continua que varía entre -5.5 mV y -4.5 mV y una amplitud de parpadeo de aproximadamente 500 µV. Si se realiza una ampliación del tramo entre 200 y 240 segundos de la Fig. 2 (Fig. 3) se ve una secuencia de 1, 2, 3, 4 y 5 parpadeos voluntarios que se pueden distinguir perfectamente por su número, pero serían imposibles de distinguir de un parpadeo involuntario. Del análisis de los picos de tensión surgió que al menos en esta primera experiencia hubiese sido muy difícil distinguir entre parpadeos voluntarios e involuntarios. También se ve en la misma figura el parpadeo voluntario de los 206 segundos ejerciendo más fuerza sobre los párpados que lo normal en un parpadeo común.

La misma medición realizada con 24 horas de diferencia mostró un comportamiento distinto, a pesar que se trató del mismo sujeto, en las mismas condiciones, con el mismo equipo y en el mismo medio ambiente. El nivel de continua de la señal en esta segunda medición estaba por encima de 10 mV, con lo cual se producía saturación del amplificador. Fue necesario intercalar un filtro pasa altos de 0.05 Hz. para bloquear la tensión continua. Este nivel de continua se debe a los potenciales de electrodo de media celda [1] y a tensiones EMG.



Figura 3. Ampliación de la Fig. 2 (último tramo)


Ruidos e interferencias en la adquisición del EOG
Antes de describir el desarrollo del equipo se realizará una breve descripción de los inconvenientes que se presentan a la hora de censar señales EOG. Se describen a continuación, las fuentes de ruido e interferencias que deben ser minimizadas a fin de poder registrar con mayor precisión estas señales bioeléctricas. Además, esto establece los requerimientos básicos necesarios para el desarrollo de un sistema adquisidor.

Debido a que la amplitud pico a pico de las señales de EOG está generalmente en el rango de µV-mV, éstas se encuentran fuertemente influidas por diferentes interferencias y fuentes de ruido que, en muchos casos, tienen amplitud mayor y espectro superpuesto a la señal que se desea medir. La Tabla 1 (Fig. 4) muestra una clasificación de los diferentes ruidos e interferencias según su origen.

Las interferencias externas son mayormente provocadas por la red de distribución eléctrica. Esta emite campos electro-magnéticos que interactúan con el equipo y el usuario produciendo una interferencia de 50Hz. Otras señales interferentes no afectan en gran medida por encontrarse fuera del ancho de banda del EOG.

La mayoría de estas interferencias han sido ampliamente tratadas en la bibliografía [3] [4] y [5], y no serán analizadas aquí, sin embargo las interferencias originadas en los potenciales de contacto electrodo-piel si serán tratadas por haber sido uno de los mayores problemas en el uso de señales EOG y por estar este equipo especialmente diseñado para enfrentarse a ese problema

Interferencias externas al equipo de medida:

Capacitivas:
Acoplamiento capacitivo con el paciente.
Acoplamiento capacitivo con los conductores y el equipo.

Inductivas:
Originadas por la interfaz electrodo-electrolito-piel.
Debidas a otros potenciales bioeléctricos.
Debidas a otros sistemas fisiológicos.
Debidas a cargas electrostáticas.

Interferencias internas al equipo de medida:
Provocadas por el transformador de la fuente de alimentación.
Debidas al rizado de la fuente de alimentación.
Ruido generado por los componentes electrónicos.
Otras fuentes: ordenadores, monitores, equipos electrónicos.


Problemática de la componente continua o potenciales de media celda de las señales EOG.
Al colocar un electrodo en contacto con la piel a través de un electrolito se produce una distribución de cargas entre la interfaz electrodo-electrolito que da lugar a la aparición de un potencial (potencial de media celda). Este potencial es una tensión continua cuyo valor supera ampliamente el nivel de la señal a medir, además, si el electrodo se mueve respecto del electrólito, se producirá una alteración en la distribución de la carga que provocará una variación transitoria del potencial de media celda. De la misma forma, en la interfaz electrolito-piel también existirá una distribución de cargas y, por tanto, un potencial de equilibrio que variará si se produce movimiento entre la piel y el electrolito. [1]



Figura 5. Ubicación de electrodos para óptima captación de la señal electrooculográfica

La colocación de los electrodos debe ser en forma perbiocular, es decir, en la vecindad de los dipolos oculares. Se utilizan cinco, dos para el canal horizontal, dos para el vertical y uno de referencia. En la figura 5 se muestra la forma correcta de colocación de los electrodos para obtener dos señales, una para el canal vertical y otra el horizontal. La relación entre los dos canales es casi ortogonal, ya que a pesar de poder diferenciarlos correctamente, existe una pequeña correlación. Los electrodos que captan la señal correspondiente al canal horizontal son los pares (AB), para el canal vertical los (CD) y la referencia es (E).

La utilización de la señal EOG como puntero, puede encontrarse seriamente afectada por variaciones en su componente continua, ya que ésta es justamente la que posee la información de posición angular del ojo. Otra consecuencia de esta tensión, es que puede provocar la saturación de los amplificadores debido a los grandes requerimientos de ganancia que éstos deben tener. La componente continua varía en relación a factores tales como:
 Perturbaciones ocasionadas por otros biopotenciales (EEG, EMG, etc.).
 Luminosidad ambiente. Variaciones en el potencial corneo-retinal.
 Variaciones producidas en los electrodos, posicionamiento y química.
 Estado del usuario (ansiedad, cansancio, etc.).
 Movimientos de la cabeza y cuerpo

FORMA DE FUNCIONAMIENTO

El comunicador oculográfico aquí descripto, es un dispositivo que trabaja acoplado en continua (es decir, no tiene filtros pasa altos). Esto implica el problema de las derivas por potenciales de media celda y biopotenciales propios del cuerpo humano. Al funcionar este dispositivo en conjunto con un teclado virtual, en el arranque del programa, se genera en la pantalla de la PC una zona de referencia inicial y cuatro puntos de calibración similar al usado en algunos de los trabajos descriptos por Barea [1]. Una vez identificado el sector de arranque y luego de la calibración, el sistema realiza una fijación de la tensión continua necesaria para mantener el cursor en ese punto por medio de otra tensión continua (generada localmente en el equipo por medio de una operación matemática realizada por el software) que se restará a la proveniente de los electrodos de manera que su diferencia sea un valor de tensión determinado e invariable llamada VPosición (siempre que el usuario no valide una nueva posición) de forma similar a la que un Lazo de Fijación de Fase (PLL) lo hace con la fase [6], [7].

Esta diferencia de potencial será la que controla la posición del cursor. En cierta forma esto mismo se puede obtener con un filtro pasa altos que bloquee la tensión continua. La diferencia está que si ahora se presenta un escalón de potencial, producto de un movimiento sacádico [8] de los ojos, un filtro pasa altos simplemente eliminaría ese nuevo potencial de continua, dejando pasar tan sólo el flanco. Lo que aquí se implementa es:
 Permitir al cursor seguir ese movimiento (lo hará sí la velocidad de crecimiento de la tensión continua generada localmente es lenta con relación a la variación de EOG).
 Antes que la diferencia entre la tensión proveniente del sensor y la generada localmente tienda al valor VPosición previamente establecido, el usuario, por medio de la validación, impondrá un nuevo valor de tensión VPosición concordante con la nueva posición del cursor, y el sistema tomará a esta nueva posición como referencia.

Dado que durante el proceso de calibración se obtuvo información del escalón de biopotencial necesario para barrer la pantalla, cualquier escalón de potencial producido por el movimiento de los ojos podrá unívocamente identificar cualquier desplazamiento del ojo a un nuevo sector de la pantalla.

La tensión EOG difícilmente varía en forma lenta, sino que lo hace en forma de escalones (movimientos sacádicos). Un ejemplo de una variación lenta sería mantener la vista en un barco que se mueve sobre el horizonte. Dado que este movimiento es improbable y sus consecuencias son variaciones lentas de tensión, similares a las variaciones temporales de las señales biológicas, algunos sistemas de registro y análisis de señales EOG simplemente los eliminan por medio de un filtrado pasa altos. Pero esto significa que ante un escalón de posición, el sistema lo derivaría (producto del filtro pasa altos) provocando un flanco y un tiempo de caída. Estos flancos también están presentes en los parpadeos, por lo que se genera una posible fuente de error que consiste en confundir parpadeos involuntarios con los flancos de los escalones.

Trabajos similares [9] han podido identificar un número de 7x6 sectores en la pantalla sin mayor problema. Cuando el ojo se desplaza para poder observar un nuevo sector en la pantalla, el cursor seguirá este movimiento debido a las variaciones de las señales de EOG. Una vez que el usuario ve que el cursor se posiciona sobre el sector deseado, lo validará mediante una acción a definir. En este caso se hace por medio de una tecla del Mouse, pero la validación dependerá fundamentalmente de las capacidades del usuario.

Esta validación cumple dos funciones, por una parte, determina la acción que el usuario quiere realizar (la cual ha sido apuntada por el cursor). Por la otra, será usada por el sistema como una realimentación de posición. Dado que se asume que el potencial de continua sigue variando, se determina ahora esa nueva posición como una nueva referencia, o sea, se ajusta todo el sistema a esa nueva posición. Mientras el ojo permanezca mirando esa posición, la fijación de continua la considerará como nueva VPosición. Cualquier nueva posición será calculada en función de esa nueva referencia y un escalón de potencial cuya relación amplitud-posición ya se conoce por medio de la calibración. Cualquier parpadeo puede ser fácilmente identificable ya que su variación será sumamente rápida y a los efectos de la señal EOG su potencial caerá al valor que tenía antes del parpadeo.

Si la cabeza se mueve lentamente durante la escritura, la recalibración (o re-referenciación) del sistema realizada en forma automática con cada validación, compensará esta variación.

La figura 6 es una gráfica de cómo podrían ser las tensiones EOG en un funcionamiento normal. Se ve entre los 90 y 100 segundos aproximadamente hay una secuencia de 7 segundos durante los cuales se seleccionaron 8 posibles zonas horizontales (se pueden distinguir 8 posibles tensiones) y durante ese intervalo de tiempo el valor de continua prácticamente no varió.



Figura 6. Variación de la señal de EOG

PROYECTO

Especificaciones que se tuvieron en cuenta al diseñar el equipo.

a) Requisitos de Performance.
 El dispositivo debe permitir escribir al menos un carácter cada 2 segundos.
 Debe poseer una interfaz gráfica amigable.
 Debe permitir ejecutar comandos de manera ágil.
 El equipo debe adaptarse no solo a cada usuario, sino también a las variaciones que la señal de EOG presente a cada momento.
b) Requisitos de Seguridad.
 El equipo debe poseer aislamiento respecto de la red eléctrica, ya que éste se encuentra en contacto con el usuario.
c) Tiempo de vida y servicio.
 Debe ser utilizado por lo menos por 30 minutos continuos, pues se estima que éste es el tiempo requerido para una sesión promedio de escritura.
 El equipo debe tener mínimos requisitos de mantenimiento.
 Los electrodos deben ser elegidos convenientemente a fin de minimizar costos de mantenimiento.

Implementación

La señal de EOG es amplificada por un amplificador de instrumentación, el cual debe poseer una ganancia tal que el mismo no sature debido a la componente continua, si esta saturación ocurriese, existiría una pérdida de información. Una vez magnificada, se superpone a la señal una tensión fija de igual magnitud pero de signo contrario a la porción continua del EOG, quedando así solo la parte variable. La cual es nuevamente amplificada y adaptada para ser adquirida.

La última etapa de amplificación posee ganancia ajustable, la cual adapta la información útil a los niveles de tensión necesarios para cubrir todo el rango de entrada del ADC. La ganancia variable es controlada por la Unidad de Control. Posteriormente la señal se convierte a formato digital y se transmite a la PC. Este esquema puede resolverse utilizando componentes de propósito general de bajo costo fácilmente obtenibles en el mercado nacional.



Figura 7. Diagrama en bloques del sistema


Amplificador de instrumentación.

Se menciona particularmente este dispositivo ya que por su costo es uno de los elementos que encarecería el diseño. Hoy en día existe en el mercado numerosos amplificadores de instrumentación (AI) integrados, los cuales poseen un alto desempeño en características cruciales para estos dispositivos. Estas son: Rechazo de Modo Común entre 100dB y 120dB, amplio rango de alimentación y bajo voltaje de offset. Sin embargo éstos resultan costosos (aproximadamente U$S 15 en Argentina). Este equipo usa una implementación alternativa utilizando Amplificadores Operacionales de propósito general, con los cuales se pueden conseguir muy buenos resultados. Esto reduce de sobre manera los costos. Se estima que el circuito amplificador puede construirse de esta forma por aproximadamente U$S 1.
Interfase Visual:
Se implementó un software con la finalidad de analizar la probabilidad de aparición de las diferentes letras y símbolos. Para esto se procesó una gran cantidad de de texto, sobre todo libros en lenguaje castellano. En base a los resultados obtenidos, se ubicaron las letras más probables en el centro de la pantalla y las menos probables en la periferia de la misma.

Para que el sistema sea mas robusto, se dividió la pantalla en tan solo 20 zonas (5 x 4), menos zonas de las 35 que se sugerían en el trabajo previo [2] (7 x 5). Por lo tanto hubo que distribuir los símbolos (letras, números, etc.) en tres teclados virtuales. Esto significó que se deberán direccionar también las zonas fuera de la pantalla.
Secuencia de comandos:
La secuencia de comandos inicia en el teclado virtual 1. Si se dirige la mirada arriba del monitor se conmuta al teclado virtual 3. Si se mira nuevamente arriba se retorna al teclado virtual 1. Dirigiendo la mirada a la derecha del monitor se conmuta al teclado virtual 2. Si se mira nuevamente a la derecha se vuelve al teclado virtual 1. Finalmente si se mira hacia abajo, aparece el menú de borrar: TODO, ULTIMA LETRA O CANCELAR. Si se mira hacia la izquierda, la PC lee lo escrito (en forma oral), utilizando el motor de Text To Speech de Windows®.

A continuación se muestran los teclados virtuales mostrados al usuario por el sistema:



Figura 8. Teclado virtual 1





Figura 9. Teclado virtual 2




Figura 10. Teclado virtual 3




Figura 11. Teclado Virtual Borrar




Figura 12. Menú principal y configuración

FUTUROS DESARROLLOS

Es evidente que este proceso de escritura puede resultar lento, por lo cual se hace deseable la implementación de algún algoritmo de predicción que le ofrezcan al usuario una cantidad de palabras posibles antes de que este deba escribir totalmente la palabra. Programas predictores tales como el PredWin ya existen, pero están diseñados para usar otro tipo de interfases gráficas que no son apropiadas para ser direccionadas por medio de señales EOG. En ese sentido, se esta trabajando en un sistema de predictor propio llamado “Casandra”.

CONCLUSIONES

Si bien el sistema no ha sido probado con pacientes, las pruebas realizadas en laboratorio demostraron no solo la viabilidad de las ideas planteadas en [2] sino la posibilidad de desarrollar instrumentos relativamente económicos que puedan ser adquiridos por usuarios de recursos limitados.
REFERENCIAS
[1] Barea, Rafael. Tesis doctoral: "Interfaz Usuario-Máquina basado en Electrooculografía. Aplicación a la ayuda a la movilidad" Universidad de Alcalá - Escuela Politécnica http://www.depeca.uah.es/personal/barea/tesis/tesis_barea_pdf.zip
[2] E. L. González, J. C. García García y J. C. Tulli, Estudio de factibilidad de un Mouse controlado por señales Electrooculográficas. XV Congreso Argentino de Bioingeniería. SABI 2007 http://www.herrera.unt.edu.ar/bioingenieria/sabi/cd_2005/pdf/054PS.pdf ,
[3] Rafael Barea, Universidad de Alcalá, Departamento de Electrónica, Instrumentación Biomédica. Sistemas de Acondicionamiento y Adquisición de Señales Bioeléctricas. http://www.depeca.uah.es/docencia/BIOING/ib/Tema3.zip
[4] Juan Ramos Castro, Tesis de Doctorado “Detección de micro potenciales Auriculares de alta frecuencia”, Capítulo 2. Universitat Politècnica de Catalunya https://www.eel.upc.es/~wwwdib/tesis/Jramos/cap2.pdf,
[5] Universidad de Alcalá, Departamento de Electrónica, Instrumentación Biomédica. Electrodos.(apuntes de cátedra)
[6] Wayne Tomasi, “Sistemas de Comunicaciones Electrónicas”, México: Pearson Educación, 1996.
[7] Bernard Sklar, “Digital Communications Fundamentals and Applications”, Prentice Hall International Editions (UK) Limited, London, 1988.
[8] http://www.uned.es/eyemovements-lab/links/tipos_movimientos.htm.
[9] J. Gips and P. Olivieri, "EagleEyes: “An Eye Control System for Persons with Disabilities", presented at the Eleventh International Conference on Technology and Persons with Disabilities, Los Angeles, March 1996
[10] Félix Jesús Alañón Fernández, Manuela Cárdenas Lara, Miguel Angel Alañón Fernández y Ana Martos Aguilera. Anatomía Y Fisiología Del Aparato Ocular http://www.esteve.es/EsteveArchivos/1_8/Ar_1_8_44_APR_18.pdf

No hay comentarios: