Traducido del inglés al español - www.onlinedoctranslator.com Revista Internacional de Medicina Legal https://doi.org/10.1007/s00414-021-02512-3 ARTÍCULO ORIGINAL Validación de comparación facial forense mediante análisis morfológico en muestras fotográficas y CCTV Nicolás Bacci1 &Tobías MR Houlton1 &Nanette &mariana espinos1 steyn1 Recibido: 10 noviembre 2020 / Aceptado: 14 enero 2021 # Los autores, bajo licencia exclusiva de Springer-Verlag GmbH, DE parte de Springer Nature 2021 Resumen Entre la disponibilidad cada vez mayor de pruebas de vigilancia y la comparación facial forense basada en expertos que se consideran admisibles en los tribunales, confirmar su validez es primordial. La comparación facial se realiza más comúnmente mediante el análisis morfológico (MA), un enfoque basado en características en gran parte no probado. Este estudio tuvo como objetivo validar la práctica recomendada actual de MA en muestras de vigilancia tanto estandarizadas como subóptimas. Se compilaron grupos de rostros de 175 hombres sudafricanos con una serie de fotografías faciales, utilizando imágenes de la base de datos Wits Face. Los primeros 75 grupos de rostros consistieron en fotografías de objetivos de alta calidad de tipo salvaje (no estandarizadas), mientras que los 100 grupos de rostros restantes consistieron en imágenes de objetivos de televisión de circuito cerrado (CCTV) subóptimas. Las imágenes objetivo se compararon con fotografías estandarizadas de alta calidad. Los grupos de rostros se analizaron utilizando las pautas y la lista de características del Grupo de trabajo científico de identificación facial. Se utilizaron matrices de confusión para determinar el desempeño de MA en cada cohorte. MA se encontró altamente preciso (precisión corregida al azar (CCA): 99,1%) y confiable (κ = 0,921) en la muestra fotográfica y menos preciso (CCA: 82,6%) y confiable (κ = 0,743), en la muestra de CCTV. Se observaron tasas más altas de falsos positivos y falsos negativos para la muestra de CCTV, y la mayoría de los errores resultaron en resultados falsos negativos. La disminución del rendimiento en la muestra de CCTV se atribuyó a varios factores, como la calidad de la imagen, el ángulo de grabación y la iluminación. Otros estudios que probaron la comparación facial identificaron precisiones y confiabilidad más bajas en varias condiciones. Palabras claveComparación facial forense. Mapeo de rostros. Identificación facial. Análisis morfológico . circuito cerrado de televisión FISWG Introducción Tribunales sudafricanos donde los FFC han contribuido a condenas exitosas. Esto destaca la importancia del uso de imágenes y grabaciones La identificación facial forense hace uso de pruebas fotográficas o de video del de alta calidad en el proceso de análisis, especialmente porque la rostro de un objetivo para confirmar su identidad y/o su posible asociación capacitación y la experiencia pueden no ayudar particularmente a con un evento delictivo. Históricamente, la comparación facial forense (FFC, identificar correctamente rostros desconocidos en grabaciones de por sus siglas en inglés) ha sido empleada por expertos presentados en circuito cerrado de televisión (CCTV) de "muy mala calidad" ( [2], pags. defensa de los sospechosos para impugnar la evidencia basada en imágenes, 25). con el fin de excluir a un sospechoso en función de rasgos faciales Debido al aumento de las pruebas fotográficas y de vídeo inconsistentes [1]. En los últimos 20 años, el testimonio pericial ha sido disponibles, el FFC, o mapeo de rostros, es ahora una práctica común en considerado admisible para la condena, siempre que las imágenes sean de muchos sistemas judiciales [3]. Si bien los esfuerzos hacia los sistemas buena calidad [1]. Varios casos también han servido en de reconocimiento facial automatizados y semiautomáticos están aumentando tanto en el sector privado como en el gubernamental (por ejemplo, [4]), los métodos y sistemas resultantes parecen ser efectivos * Nicolás Bacci [email protected] ; [email protected] solo en entornos altamente estandarizados (p. ej. [5]). Este requisito de configuración estandarizada resulta principalmente de la dependencia de estos sistemas en la información antropométrica facial para 1 Unidad de Investigación de Identificación y Variación Humana, Facultad comparar caras con precisión [6,7]. A pesar de los recientes intentos de de Ciencias Anatómicas, Universidad de Witwatersrand, 7 York Road, estandarización [8], la fotoantropometría, la aplicación de la Parktown, Johannesburgo 2193, Sudáfrica antropometría facial a la comparación de imágenes, ha sido Int J Legal Med demostrado ser incapaz de discernir a los individuos objetivo tanto Fotografías e imágenes seleccionadas de imágenes de CCTV dentro de grupos para la identificación como para la exclusión [9,10]. Esto se complica de rostros. aún más por el requisito de la aplicación de fotogrametría para extraer dimensiones en muchas imágenes con el fin de efectuar una comparación, algo que no es posible si las imágenes no están Materiales y métodos altamente estandarizadas [11] o de calidad suficiente [9]. Como resultado, el método recomendado para realizar comparaciones Este proyecto forma parte de un estudio más amplio. Todas las imágenes fueron extraídas de la base de datos faciales individuales para procesos penales o judiciales es el análisis Wits Face [30]. La muestra incluyó fotografías faciales e imágenes extraídas de grabaciones de CCTV de un total morfológico.9,12]. de 175 participantes individuales conocidos que dieron su consentimiento. Todos los participantes eran adultos El análisis morfológico se usa regularmente en el contexto judicial en jóvenes sudafricanos de ascendencia africana. Estas fotografías fueron capturadas a una altura de 1600 mm, todo el mundo a pesar de que universalmente se considera de resultando un ángulo de incidencia efectivo de 0° en relación al rostro del participante. Las fotografías naturaleza altamente subjetiva [11] y las pruebas limitadas de su estandarizadas (ST) se capturaron con una cámara DSLR Canon 1300D de 18 MP (lente Canon de 18–55 mm DC) a exactitud o eficacia [12,13]. De hecho, ningún otro estudio experimental una distancia del objetivo a la cara de 1500 mm con un fondo de tela de terciopelo negro y tela para ocultar la ha probado la precisión de la comparación facial mediante análisis ropa de los participantes. Las fotografías de "tipo salvaje" no estandarizadas (WT), destinadas a simular morfológico.11]. El análisis morfológico se basa en la opinión de un fotografías subóptimas pero con una cámara de calidad similar, se capturaron con una Sony SLT A57 (18–250 experto en análisis facial sobre el grado de similitud facial entre rostros mm Sony Zoom Lens) a una distancia de 5000 mm. Estas fotografías fueron capturadas en cinco vistas o poses desconocidos [14]. En circunstancias que involucran rostros familiares, faciales: vista anterior, 45° derecho, lateral derecho, 45° izquierdo y lateral izquierdo. La resolución de imagen incluso sin el uso de análisis morfológico, los testigos presenciales y para las fotografías ST y las fotografías WT fue de 3456 × 4320 píxeles a 300 ppp y 3264 × 4080 píxeles a 350 ppp, otras personas no capacitadas previamente familiarizadas se consideran respectivamente. Las grabaciones de CCTV se extrajeron de una cámara de Protocolo de Internet (IP) (HikVision, adecuadamente capaces de identificar a las personas incluso en modelo: DS-2CD2142FWD-I, 4 megapíxeles) previamente instalada para vigilancia en la Universidad de imágenes de baja calidad y filmaciones de CCTV.15,dieciséis]. Sin Witwatersrand. La distancia entre el objetivo y la cara de la cámara CCTV fue de aproximadamente 3030 mm, y el embargo, el público ha sido evaluado como generalmente pobre en la ángulo de incidencia fue de aproximadamente 27°, calculado en base a la altura media de la población del identificación de caras desconocidas [dieciséis–18] y la evidencia de estudio (hombres sudafricanos) de 1708 mm [ La resolución de imagen para las fotografías ST y las fotografías testigos oculares ha sido cuestionada cuando se trata de rostros WT fue de 3456 × 4320 píxeles a 300 ppp y 3264 × 4080 píxeles a 350 ppp, respectivamente. Las grabaciones de desconocidos [19,20]. Se han realizado pruebas del rendimiento de CCTV se extrajeron de una cámara de Protocolo de Internet (IP) (HikVision, modelo: DS-2CD2142FWD-I, 4 conceptos amplios de FFC, pero se centraron principalmente en la megapíxeles) previamente instalada para vigilancia en la Universidad de Witwatersrand. La distancia entre el influencia de la experiencia de los analistas para lograr los mejores objetivo y la cara de la cámara CCTV fue de aproximadamente 3030 mm, y el ángulo de incidencia fue de resultados [2,21] o para probar las interacciones psicológicas implicadas aproximadamente 27°, calculado en base a la altura media de la población del estudio (hombres sudafricanos) en la identificación facial (p. ej. [18,22,23]). Para que los expertos en FFC de 1708 mm [ La resolución de imagen para las fotografías ST y las fotografías WT fue de 3456 × 4320 píxeles a realicen correctamente el proceso de análisis morfológico, se 300 ppp y 3264 × 4080 píxeles a 350 ppp, respectivamente. Las grabaciones de CCTV se extrajeron de una recomienda realizar una comparación sistemática para comparar una cámara de Protocolo de Internet (IP) (HikVision, modelo: DS-2CD2142FWD-I, 4 megapíxeles) previamente lista específica de características en cada análisis [12]. Esta comparación instalada para vigilancia en la Universidad de Witwatersrand. La distancia del objetivo a la cara de la cámara característica por característica del rostro entre una imagen de destino y CCTV fue de aproximadamente 3030 mm, y el ángulo de incidencia fue de aproximadamente 27°, calculado en una muestra de referencia se puede realizar siguiendo cualquiera de las base a la altura media de la población del estudio (hombres sudafricanos) de 1708 mm [31]. Las imágenes fijas se múltiples listas de características disponibles [12,24,25]. Si bien estudios obtuvieron de las grabaciones de CCTV de los individuos coincidentes en las mismas cinco vistas capturadas en la recientes han demostrado que tanto las instrucciones de características muestra fotográfica. Estas imágenes y fotografías se combinaron en ensayos de grupos de rostros basados en como las comparaciones característica por característica benefician la individuos visualmente similares en términos generales para probar la eficacia de la lista de características precisión de las comparaciones faciales [26,27], las listas de faciales del FISWG para la identificación individual. características específicas no se han probado exhaustivamente. Aunque se han realizado algunas pruebas limitadas de la eficacia de la comparación facial utilizando listas de características faciales [24,28], el Este estudio incluyó un total de 175 pruebas de grupo de caras, cada una más extenso, aunque en gran parte no probado [13], la lista de compuesta por una fotografía facial de un solo objetivo agrupada con nueve componentes y descriptores faciales fue publicada por el Grupo de imágenes de lámina y una imagen que coincidía correctamente (pruebas de trabajo científico de identificación facial (FISWG) [29]. Como tal, se prueba) o 10 imágenes de lámina (pruebas sin coincidencia). Las imágenes de requiere una prueba detallada de análisis morfológico basado en la aluminio se asignaron a conjuntos de rostros en función del parecido facial comparación característica por característica para confirmar la precisión relativo y la edad aparente. Esto fue realizado por un asistente de y validar el uso de este enfoque en la identificación facial forense. investigación, para asegurar el cegamiento del analista principal. Estos Por lo tanto, el objetivo de este estudio fue utilizar la lista FISWG prescrita de características morfológicas, para evaluar su capacidad para conjuntos de rostros se agruparon por el tipo objetivo de imágenes faciales y se organizaron en vistas o poses faciales correspondientes. Los primeros 75 identificar con precisión a individuos desconocidos tanto en fotografías grupos de caras incluían una fotografía de objetivo de alta resolución de "tipo no estandarizadas como en imágenes de CCTV. Para ello, se compararon salvaje" (WT), cada una comparada con 10 imágenes faciales de una base de fotografías estandarizadas de una gran base de datos de individuos datos compuesta por fotografías óptimas estandarizadas (ST) con ropa sudafricanos con fotografías no estandarizadas. oscurecida. Las 100 piscinas restantes estaban compuestas por un Int J Legal Med fotograma capturado de grabaciones CCTV estándar e imágenes faciales Directrices FISWG [12]. La revisión holística se realizó como una breve 10 ST. A lo largo de todas las comparaciones faciales, cada imagen revisión de toda la cara, con un límite de tiempo autoimpuesto y objetivo se comparó con una sola fotografía de las 10 fotografías del controlado de 5 s para evitar una revisión detallada de los rasgos grupo de rostros agrupados a la vez. Las imágenes extraídas de CCTV se faciales. Luego se tomó una decisión sobre si los individuos podían ser recortaron con la misma relación de aspecto (4:5) que las imágenes compatibles o no, o si la comparación no era posible. Las comparaciones fotográficas con el rostro centrado de la misma manera, lo que dio como holísticas se calificaron como una posible coincidencia prospectiva (1), resultado que las imágenes tuvieran una resolución aproximada de 368 no una coincidencia (2) o ningún análisis posible (3). Solo las × 460 píxeles a los 96 ppp nativos de CCTV. cámara. De esta forma, el coincidencias prospectivas se compararon más mediante el análisis rostro representó aproximadamente 1/9 de la imagen completa, morfológico. El análisis morfológico (MA) se realiza de manera similar al resultando en un rostro compuesto por aproximadamente 41 × 52 uso de un enfoque de análisis, comparación, evaluación y verificación píxeles. Se permitió un número limitado de 15 usos repetidos como (ACE-V) [12]. ACE-V es la metodología más común empleada en los máximo por fotografía ST mientras se compilaban grupos de rostros exámenes de huellas dactilares y consiste en un proceso sistemático por para evitar la familiarización del analista principal. etapas que se ha comparado con el método científico [32]. Cuando un analista forense aplica una metodología ACE-V, primero analizará la Cada grupo de caras incluía una distribución relativamente anatomía y el detalle de los datos disponibles, seguido de una uniforme de vistas, o poses faciales, del objetivo y las caras comparación entre los conjuntos de datos disponibles y, por último, correspondientes (Tabla1). Se incluyeron diferentes poses faciales evaluará la información obtenida de la comparación para llegar a una en el estudio para permitir una revisión variada de la cara completa conclusión.32]. La fase de verificación luego incluye la confirmación por de los individuos comparados. La distribución uniforme de las parte de un analista adicional que vuelve a probar la conclusión original [ poses faciales a lo largo de la composición de los grupos de rostros 32]. La fase de verificación no se llevó a cabo en todos los análisis del permitió que todas las partes de la lista de características se usaran presente estudio debido a limitaciones de tiempo. La comparación de y exploraran a lo largo de este análisis. Incluir una sola vista, MA se realizó utilizando la lista de descriptores y características de aunque fortalece el poder del análisis, limitaría las características componentes faciales del FISWG [29] resumido en la Tabla3. faciales revisadas y no sería representativa de la cara completa. A su vez, esto permitió una comparación de la eficacia de la lista de El análisis morfológico se llevó a cabo colocando ambas imágenes funciones en las diversas poses. una al lado de la otra en Microsoft PowerPoint (365, v. 16) y se ajustó para que se asemejaran en la rotación y el tamaño de una a otra, Es importante asegurarse de que las observaciones sean fiables y repetibles. Entre estos grupos de caras, se incluyeron ensayos repetidos manteniendo la relación de aspecto original. Luego se compararon y para permitir el cálculo del error intraobservador. Estos rastros contrastaron las características morfológicas de la cara en busca de repetidos se distribuyeron dentro de la muestra de análisis de modo que similitudes o diferencias (Fig.1). Estos se destacaron en orden numérico la primera aparición original del mismo grupo de rostros y el orden de según la lista de componentes faciales del FISWG y se utilizaron para las fotografías dentro del grupo de rostros fueran lo suficientemente tomar una decisión final para cada posible coincidencia. Las decisiones distantes como para descartar la familiarización. El desglose de la finales para cada comparación facial se tomaron utilizando una versión muestra para cada cohorte de análisis se detalla en la Tabla2. adaptada del sistema de niveles de acuerdo utilizado por el Servicio de Policía de Sudáfrica [14]. Para evaluar el acuerdo entre observadores, un experto en comparación Las clasificaciones y definiciones de los niveles de acuerdo facial realizó una serie de comparaciones faciales en un subconjunto de cinco conjuntos de rostros de cada cohorte (un total de 10 conjuntos de rostros, adaptados y declaraciones resumidas empleadas por los Servicios incluidas 100 comparaciones faciales individuales en total). Luego, esto debía de Policía de Sudáfrica (adaptado de Steyn et al. [14]) se describen a contrastarse con el primer conjunto de análisis realizado por el investigador continuación: principal para el cálculo de la concordancia entre observadores. 1.Conclusión: positiva. Teniendo en cuenta la correspondencia de las La comparación facial se realizó utilizando las pautas del FISWG sobre comparación facial. Para replicar un escenario realista, el analista características generales de clase y la presencia de características primero examinó brevemente cada una de las coincidencias potenciales únicas de identificación individual que se encontraron durante el de un grupo de rostros utilizando una revisión holística de acuerdo con análisis entre la persona en las Imágenes objetivo y tabla 1Distribución de poses faciales en toda la muestra de grupo de rostros Cohorte de análisis Vista anterior Vista 45° izquierda Vista lateral izquierda Vista 45° derecha Vista lateral derecha Pruebas de análisis totales Fotografía WT a fotografías ST 14 18 Norma CCTV a fotografías ST 14 17 S T,estándar;peso,tipo salvaje;circuito cerrado de televisión,circuito cerrado de televisión 13 17 13 20 13 22 67 94 Int J Legal Med Tabla 2Ensayos de grupos de personas por análisis: desglose de submuestras de cohortes Cohorte de análisis Fotografía WT a fotografías ST CCTV a fotografías ST Ensayos de prueba Ensayos sin coincidencia Repita los ensayos Ensayos de análisis Ensayos totales 59 86 8 8 8 6 67 94 75 100 Los ensayos de prueba fueron ensayos normales únicos que incluyeron un objetivo y nueve floretes y una coincidencia correcta; Los ensayos sin coincidencias incluyeron un objetivo y diez imágenes de lámina. S T,estándar;peso,tipo salvaje;circuito cerrado de televisión,circuito cerrado de televisión en las Fotografías de Control, se encuentra que la persona en las visible entre la persona en las imágenes objetivo y en las fotografías imágenes objetivo y en las imágenes de control probablemente de control. Sin embargo, debido a la mala calidad, los niveles de luz, representan a la misma persona. el ángulo y la distancia de las cámaras objetivo, el metraje objetivo es demasiado pobre para marcar suficientes puntos de referencia 2.Conclusión: no concluyente (pero con cierta correspondencia en morfológicos faciales específicos. Por lo tanto, no se pudo realizar algunas características morfológicas visibles). No es posible obtener una comparación facial detallada entre las imágenes objetivo y las resultados concluyentes con respecto a la identificación/ imágenes de control. Por lo tanto, no es posible obtener resultados individualización porque, durante la evaluación, se descubrió que la concluyentes con respecto a la identificación porque se encontró calidad de las imágenes objetivo era demasiado mala para que las imágenes de destino eran demasiado pobres. distinguir suficientes características identificables y únicas. Sin embargo, algunas similitudes morfológicas fueron visibles entre la 4.Conclusión: negativa. Teniendo en cuenta la falta de correspondencia persona en las imágenes objetivo y en las fotografías de control. de las características generales de clase y las características únicas Debido a pruebas insuficientes, la persona en las imágenes objetivo de identificación individual que se encontraron durante el análisis y las fotografías de la base de datos no pudieron identificarse como entre la persona en las imágenes objetivo y en las fotografías de la misma persona, pero tampoco pudieron eliminarse por no ser la control, se encontró que la persona en las imágenes objetivo y en misma persona. las imágenes de control no es la misma persona. 3.Conclusión: no concluyente (pero con alguna correspondencia en apariencia holística). De acuerdo con una comparación holística, existen características generales correspondientes Tabla 3Lista resumida de componentes faciales para comparación facial por análisis morfológico [29] Número 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 dieciséis 17 18 5.Conclusión: ningún análisis es posible. Las imágenes del metraje de destino eran de mala calidad. Debido a la baja calidad componente facial Piel (textura, color, tono, etc.) Contorno de la cara/ cabeza (contorno) Composición de la cara/cabeza (proporciones) Línea del cabello/patrón de calvicie (forma detallada) Frente (tamaño y contorno relativos) Cejas (ángulo, forma, tamaño relativo y detalles del cabello) Ojos (color, posición, ángulo, tamaño relativo, etc.) Mejillas (prominencia y hoyuelos) Nariz (forma, posición, simetría, tamaño relativo, etc.) Orejas (forma, posición, protuberancia y tamaño relativo) Boca (angulación, forma, simetría, tamaño relativo, etc.) Mentón/mandíbula (forma, tamaño relativo, simetría, prominencia y definición) Cuello (tamaño relativo, prominencia, pliegues, venas, etc.) Vello facial (presencia, distribución, longitud, estilo, detalles del cabello, etc.) Líneas faciales (pliegues, arrugas, etc.) Cicatrices (ubicación, forma, orientación, tamaño relativo, tonalidad, profundidad, etc.) Marcas faciales (lunares, manchas de decoloración, pecas, etc.) Alteraciones (tatuajes, piercings, etc.) Int J Legal Med Figura 1Ejemplo de análisis de comparación facial. Se colocó una imagen objetivo de CCTV o fotografía de tipo salvaje (WT) junto a cada posible coincidencia en función de la posible coincidencia positiva durante el análisis holístico. La fotografía estandarizada (ST) de la derecha se comparó con la imagen objetivo extraída de CCTV de la izquierda usando el Lista de componentes faciales FISWG [ 29]. Los componentes faciales similares (azul) y diferentes (rojo) se destacaron por número de componente facial de las imágenes y un ángulo de cámara o distancia de cámara o la mayor proporción de las clases observadas [36], de dondepags deficientes, no se pudieron identificar suficientes puntos de El valor se calcula para confirmar si la precisión es mayor que el NIR referencia morfológicos faciales y, por lo tanto, no se pudo realizar como indicador de un buen modelo predictivo [35]. También se una comparación facial. calcula una prueba de McNemar como parte de la función para determinar si las coincidencias puntuadas tienen una proporción de Para facilitar el análisis estadístico, estas posibles conclusiones se errores similar o diferente en la cohorte de prueba [37], donde un ajustaron para el cálculo de la tasa de aciertos como coincidencia correcta valor de p por debajo de α = 0,05 indica una diferencia en la (puntuaciones 1, 2), no coincidencia (puntuaciones 3, 4) o análisis no proporción de errores. Esta comparación indica efectivamente si el concluyente (puntuación 5). Estas conclusiones, que incluyeron los ensayos método de análisis falla relativamente por igual en falsos positivos y excluidos como "no coincidentes" en la fase de revisión holística del análisis, falsos negativos. se compararon luego con el verdadero emparejamiento de las imágenes para La serie de fórmulas utilizadas para calcular la calidad del poder predictivo calcular la tasa de aciertos del investigador principal. Los resultados de cada para el análisis morfológico dentro de cada cohorte de submuestra se extrajo comparación se clasificaron como tales, en función del emparejamiento del paquete Caret R [35,36], se definen a continuación y se presentan en su verdadero, ya sea como un verdadero positivo (TP), un falso positivo (FP), un totalidad comoInformación suplementaria(SI). La sensibilidad, o tasa de falso negativo (FN), un verdadero negativo (TN) o un análisis no concluyente ( I verdaderos positivos o recuerdo, se define como la medida de la eficacia con A). la que una prueba puede realizar coincidencias correctas (SI: Eq.1). La Todos los análisis estadísticos se realizaron con el programa de especificidad, o tasa de verdaderos negativos, es una medida de cuán efectiva estadísticas R Studio (versión 3.6.3) [33]. La precisión de la identificación una prueba puede descartar correctamente una coincidencia (SI: Eq.2). La facial para cada tipo de grupo de ensayos se obtuvo mediante el cálculo prevalencia es el número total de coincidencias verdaderamente correctas en de la tasa de aciertos y la mitigación de la probabilidad mediante la toda la muestra de la cohorte (SI: Eq.3). El valor predictivo positivo (VPP) indica realización de un kappa de Cohen ponderado. La precisión real objetivo la probabilidad de un para que el método se considere exitoso fue un valor kappa de 0,80 o superior [34]. Los acuerdos intra e interobservador se calcularon utilizando el kappa de Cohen ponderado con respecto a las decisiones de emparejamiento. A partir de la tasa de aciertos de las comparaciones, se calculó una Tabla 4Referencia de tabla de contingencia para matriz de confusión de coincidencias positivas y negativas (adaptado de Kuhn [35]) matriz de confusión completa que incluye múltiples medidas de poder predictivo a partir de una tabla de contingencia (Tabla4). La función de matriz de confusión en R calcula a partir de la tabla de contingencia una precisión general bruta al dividir las puntuaciones correctas totales por Coincidencia de cara verdadera Exclusión de cara verdadera Emparejado por el analista Verdadero positivo (TP) Falso positivo (FP) Excluido por el analista Falso negativo (FN) Verdadero negativo (TN) la muestra total, junto con un intervalo de confianza del 95 %. Esta Las fórmulas empleadas en cada subconjunto de análisis para comparar la calidad predictiva precisión general se compara luego con una tasa sin información (NIR), de los análisis se basan en esta tabla de contingencia Int J Legal Med prueba calificada como una coincidencia siendo verdaderamente una coincidencia correcta (SI: Eq.4) y el valor predictivo negativo (VAN) es la probabilidad de que un ensayo calificado como una exclusión sea realmente una exclusión correcta (SI: Eq.5). La tasa de detección es la proporción de la muestra de la cohorte que coincide correctamente (SI: Eq.6), y la prevalencia de detección es la proporción de puntajes emparejados por el analista a lo largo de la cohorte de análisis (SI: Eq.7). Idealmente, en esta muestra, la tasa de detección sería lo más cercana posible al 9 o 10 % debido a cómo se organizó la muestra. Un cálculo de precisión ajustada que considera la distribución desequilibrada de la muestra es la precisión equilibrada calculada utilizando la ecuación.8 (SI) haciendo uso de la sensibilidad y la especificidad. La relación entre las En las Figs.2y3tanto para la fotografía a fotografía (Fig.2) y comparaciones de CCTV a fotografía, respectivamente (Fig.3). Ninguna comparación facial de la cohorte de ensayo de fotografía a fotografía se clasificó como no concluyente, y ningún ensayo se excluyó del análisis adicional de esta cohorte (Fig.2). No se pudo completar un total de 26 coincidencias potenciales y se clasificaron como análisis no concluyentes en la cohorte de análisis de CCTV y se excluyeron del análisis (Fig.3). Esto se debió a una combinación de mala calidad y mala iluminación en algunas de las grabaciones de CCTV. Las matrices de confusión confirmaron un mejor rendimiento coincidencias correctamente asignadas y el total de coincidencias general de MA dentro de la muestra de fotografía a fotografía. Este positivas realizadas por el analista se denomina precisión y se calcula mejor desempeño se destaca en las tablas de contingencia para cada utilizando la ecuación.9(SI). Por último, elFLa puntuación es una media cohorte de análisis (Tablas6y7). La precisión general sin procesar entre ponderada (armónica) de precisión y sensibilidad calculada utilizando la las cohortes de análisis fue notablemente mayor para el MA de ecuación.10(SI) y considera las designaciones de falsos positivos y falsos fotografía a fotografía (0,997, IC = 0,989–0,999) sobre CCTV, aunque los negativos. Esto se calcula ajustando el peso de la precisión y la MA de la cohorte de CCTV también fueron bastante precisos (0,942, IC = sensibilidad en la ecuación; en este estudio, se dio la misma ponderación 0,925–0,956) (Tabla8). La precisión bruta tiene un uso limitado en el a ambos. Como tal en la Ec.10, a β se le asigna un valor de 1 y la análisis del rendimiento de MA, ya que no tiene en cuenta la puntuación se denominaF1puntaje. composición de la muestra y el azar, ya que es un cálculo directo de la Las tasas de falsos positivos y falsos negativos para todas las tasa de aciertos. Todos los grupos de análisis tuvieron una mayor cohortes de análisis también se calcularon por separado para precisión que el NIR (Tabla8), lo que es indicativo de un buen modelo resaltar el tipo de errores asociados con cada cohorte. Todos predictivo de análisis morfológico en general. los análisis descritos anteriormente se realizaron en dos umbrales diferentes para comparar el rendimiento del análisis Las precisiones corregidas al azar (CCA) de MA indicaron una disminución en la fuerza predictiva de las comparaciones de morfológico dentro de una iteración indulgente y estricta. La fotografía a fotografía (κ = 0.982;pag <0,001) con las comparaciones iteración indulgente se describió anteriormente, incluidas las de CCTV (κ = 0,710;pag <0,001) (Tabla8). La precisión de la cohorte comparaciones calificadas como 1 y 2 como coincidencias y 3 y de CCTV se mantuvo por debajo de la puntuación considerada "casi 4 como no coincidentes; sin embargo, la iteración estricta perfecta" de 0,80 [34]. Dentro de la cohorte de fotografía a incluye estrictamente puntajes de 1 como coincidencias fotografía no hubo una proporción estadísticamente significativa de positivas mientras consolida puntajes de 2 a 4 y los trata como errores (Tabla8), lo que es indicativo de los resultados falsos no coincidentes. . Esto tenía la intención de permitir que solo se positivos y falsos negativos marcadamente bajos (Tablas6y7). Una considerara el nivel más alto de coincidencias basadas en la mayor tasa de falsos positivos (Tabla9) se evidencia por la mayor confianza, para intentar reducir los resultados falsos positivos. prevalencia de detección frente a la tasa de detección de la cohorte Se utilizaron pruebas de chi-cuadrado para comparar la de análisis de CCTV, lo que resulta en una precisión marcadamente ocurrencia de coincidencias positivas verdaderas, menor (Tabla9). UnF1También se observa una puntuación inferior a 0,8 como resultado de la mayor tasa de falsos positivos en el análisis de CCTV (Tabla9). Se llevó a cabo una segunda iteración estricta de análisis estadísticos ajustando el umbral de coincidencias correctas para incluir solo Resultados conclusiones positivas (puntuación de 1). Esta interpretación más estricta pretendía reducir el riesgo de resultados falsos positivos. En esta La comparación del acuerdo intraobservador e interobservador en iteración, las precisiones corregidas al azar fueron mayores para grupos de rostros analizados por MA indicó un nivel de acuerdo fotografía a fotografía (κ = 0,991;pag < 0,001) y CCTV (κ = 0,826;pag < bueno a alto. La concordancia intraobservador fue mayor para MA 0.001) cohortes que la anterior iteración indulgente del análisis. El (κ = 0,934;pag <0,001) en las comparaciones de fotografía a aumento en la precisión resulta de la iteración estricta que asigna fotografía sobre la comparación de CCTV a fotografía (κ = 0,807; correctamente algunas de las coincidencias positivas falsas presentes en pags < 0,001) (Tabla5). La concordancia entre observadores en los la iteración indulgente a coincidencias negativas verdaderas. Las ensayos de fotografía a fotografía fue casi perfecta (κ = 0,921;p = matrices de confusión también demostraron una marcada disminución 0,001) (Tabla5), pero los ensayos de CCTV a fotografía mostraron de falsos positivos (Tablas10y11) y un ligero aumento de falsos una ligera disminución en la concordancia pero aún con un nivel negativos en la cohorte de CCTV (Tabla11). La precisión bruta de la sustancial de concordancia (κ = 0,743;pag <0,001) (Tabla5). predicción también pareció Int J Legal Med Tabla 5Resumen de acuerdos entre Acuerdo intra-observador pagsvalor Acuerdo entre observadores pagsvalor De fotografía a fotografía 0.934 < 0.001 0.921 = 0.001 CCTV a fotografía 0.807 < 0.001 0.743 < 0.001 observadores e intraobservador en todas las cohortes de análisis incremento basado en la matriz de confusión (Tabla12). La falta de dio como resultado que la prueba de McNemar no indicara una resultados falsos positivos y los resultados falsos generales proporción estadísticamente significativa de errores (Tabla12). El cambio extremadamente bajos en la cohorte de fotografía a fotografía (Tabla10) en falsos positivos y negativos se evidenció por la disminución de Figura 2Gráficos de barras de los resultados de la comparación facial bajo un indulgente (a)y estricto (B)iteración dentro de la cohorte de fotografía a fotografía por ensayo. TP, verdadero positivo; FP, falso positivo; NT, verdadero negativo; FN, falso negativo; IA, análisis no concluyente Int J Legal Med Fig. 3Gráficos de barras de los resultados de la comparación facial bajo un indulgente (a)y estricto (B)iteración dentro de la cohorte de CCTV a fotografía por prueba. TP, verdadero positivo; FP, falso positivo; NT, verdadero negativo; FN, falso negativo; IA, análisis no concluyente sensibilidad en la cohorte de CCTV y, en particular, el aumento de la (Mesa13), lo que indica un mejor rendimiento general de la especificidad en ambas cohortes en la iteración de análisis estricto (Tabla13). interpretación de puntuación estricta y lo destaca como el enfoque Esta disminución de la sensibilidad en la cohorte de CCTV da como resultado ideal para aplicaciones forenses. Las tasas de falsos positivos (FPR) y una precisión equilibrada ligeramente disminuida. Sin embargo, también las tasas de falsos negativos (FNR) calculadas en las cohortes de resultó en una precisión notablemente mayor yF1puntaje análisis indican una FPR más alta y una FNR más alta en el CCTV Int J Legal Med Tabla 6Tabla de contingencia para matriz de confusión de comparación cara real cara real cara real cara real fotografía a fotografía iteración partido exclusión partido exclusión Emparejado por el analista PT = 61 FP = 1 Combinación perfecta ideal PT = 62 FP = 0 Excluido por el analista FN = 1 TN = 607 Exclusiones perfectas ideales FN = 0 TN = 608 indulgente tp,verdadero positivo;FP,falso positivo;TENNESSE,verdadero negativo;fn,falso negativo;I A,análisis no concluyente cohorte sobre la única cohorte fotográfica (Tabla14), lo que encontrados por expertos en el entorno forense. La eficacia de MA demuestra el beneficio general del uso de imágenes de mayor en esta muestra actual dio como resultado precisiones calidad en la comparación facial. Al considerar la iteración estricta, notablemente altas, que oscilaron entre el 71 y el 99 %, según el aunque se observó una disminución notable en FPR en la muestra tipo de muestra y la rigurosidad del análisis. Además, también se de CCTV, también se identificó una duplicación paralela de FNR identificó un nivel particularmente alto de concordancia (Tabla14). En todos los ensayos, exactitud equilibrada, precisión yF1 intraobservador e interobservador entre las cohortes, que va desde las puntuaciones fueron más altas en la muestra de fotografía a sustancial (κ = 0,743) hasta casi perfecto (κ = 0,934). Se observó un fotografía. rendimiento notablemente mejor en la muestra fotográfica, tanto Por último, las pruebas de chi-cuadrado que compararon el rendimiento de MA en diferentes vistas no demostraron diferencias estadísticamente en términos de precisión (precisión bruta (RA): 99,7 %; precisión equilibrada (BA): 99,2 %, precisión corregida al azar (CCA): 96,8 %) significativas en el rendimiento de ninguna vista facial en particular. Este como intra y concordancia interobservador (κ = 0,934 y κ = 0,921, resultado indicó que no se puede determinar una relación real con la respectivamente). Se esperaba este resultado, teniendo en cuenta obtención de un mayor número de coincidencias correctas en una vista facial la calidad marcadamente superior y la mejor correspondencia de específica. Esto sugiere que siempre que se vean suficientes características en ángulo de visión de las fotografías estandarizadas y de tipo salvaje. imágenes de CCTV subóptimas, cada vista puede proporcionar suficiente La correspondencia y mayor calidad de las imágenes permitió a su información para comparar caras con precisión. vez una revisión profunda del componente facial y por ende, una decisión más informada. Cuando MA no pudo identificar coincidencias correctamente, resultó predominantemente en falsos Discusión negativos tanto en muestras fotográficas (1,61%) como de CCTV (11,63%). Los resultados falsos positivos fueron, de hecho, El uso común de las pruebas faciales fotográficas y de notablemente más bajos que los falsos negativos en ambas videovigilancia en el ordenamiento jurídico [38,39] ha llevado a una muestras (fotografía: 0,16 % y CCTV: 5,19 %). mayor necesidad de comparación facial forense (FFC). Por lo tanto, Los falsos positivos y los falsos negativos se consideran sensibilidad y probar la validez de FFC es crucial para la admisibilidad de esta especificidad al comparar el rendimiento del método de prueba. En un evidencia y procesos legales precisos. FFC empleado en una entorno práctico, el límite predictivo de cualquier prueba se escala para muestra de cara desconocida es un campo muy poco estudiado en obtener la proporción óptimamente aceptable de sensibilidad y la identificación craneofacial, y la mayoría de los estudios se centran especificidad. Esto no fue del todo posible en este estudio, ya que los en el beneficio de la experiencia en FFC (por ejemplo, [2,21]). resultados de las comparaciones faciales se asignan en función de un Confirmar que el trabajo de los expertos en comparación facial es sistema de puntuación ordinal limitado de cuatro escalas que solo se valioso y admisible es vital para la consideración de sus informes. puede ajustar razonablemente en dos niveles. Sin embargo, al realizar Sin embargo, es importante evitar que esta evidencia basada en la una iteración indulgente y estricta del análisis de datos, fue posible experiencia se integre en la corte sin confirmación sobre la controlar, dentro de los límites, el rendimiento del análisis morfológico precisión de este método [39]. Como tal, la validez del enfoque más para identificar la iteración óptima que se utilizará en el entorno forense. aceptado y utilizado para FFC, a saber. análisis morfológico, En la iteración estricta, se evidenció una drástica reducción de falsos necesita ser probado y confirmado. positivos tanto para la muestra fotográfica (de 0,16 a 0%) como para las El presente estudio es el primero en probar exhaustivamente la precisión de MA en un escenario actual, simulando condiciones Tabla 7Referencia de tabla de cohortes de análisis de CCTV (de 5. 19 a 0,60%). Esta baja tasa de falsos positivos es indicativa de la contingencia para matriz de confusión cara real cara real cara real cara real de CCTV a fotografía partido exclusión partido exclusión Emparejado por el analista PT = 76 FP = 43 Combinación perfecta ideal PT = 86 FP = 0 Excluido por el analista FN = 10 TN = 785 Exclusiones perfectas ideales FN = 0 TN = 828 comparación indulgente iteración tp,verdadero positivo;FP,falso positivo;TENNESSE,verdadero negativo;fn,falso negativo;I A,análisis no concluyente Int J Legal Med Tabla 8Resultados de la función de Fotografía a fotografía matriz de confusión y precisiones corregidas al azar a lo largo de la iteración indulgente del análisis CCTV a fotografía Precisión bruta general 0.997 Intervalo de confianza del 95 % Tasa 0.989–1.000 0,925–0,956 de ausencia de información (NIR) 0.908 0.906 Valor de p (Acc>NIR) Valor p de la prueba de McNemar Exactitud corregida al azar (CCA) Valor p (para CCA) < 0.001 1 0.942 < 0.001 < 0.001 98,2% 71,0% < 0.001 < 0.001 importancia de una escala de niveles de concordancia con criterios precisiones corregidas al azar (99.1 y 82.6%) en ambas cohortes de distintos como el empleado en el presente estudio [14], lo que muestra. La precisión equilibrada disminuyó ligeramente en la puede permitir asignar conclusiones finales de una manera más muestra de CCTV (88,1 %) como resultado de la disminución de la estricta que la sugerida anteriormente por el Bromby [40] escala de sensibilidad (0,767) de la iteración estricta como resultado de la apoyo. La desventaja de este enfoque más estricto es que casi se mayor tasa de falsos negativos. Incluso los valores predictivos duplica la tasa de falsos negativos encontrada en las imágenes positivos fueron más altos para la iteración estricta en ambas subóptimas de la muestra de CCTV (de 11,63 a 23,26 %). Esta tasa cohortes (1,000 y 0,930) con valores predictivos negativos más alta de resultados falsos negativos identificados podría relativamente constantes (0,998 y 0,977). Lo más importante, la atribuirse parcialmente al efecto del carácter distintivo. Las caras precisión más alta (1.00 y 0.930) yF1También se lograron que se componen de características más distintas o únicas son puntuaciones (0,992 y 0,841) en la iteración estricta, lo que indica el intrínsecamente más fáciles de igualar [41,42] o descartar, mientras mejor rendimiento general de un modelo estricto. Debido a su que es más probable que se reconozcan las caras que son más menor precisión corregida al azar, y menor precisión yFpuntajes, el típicas con tipos de características más "habituales" [41], lo que modelo indulgente solo debe aplicarse en un contexto forense daría lugar a que se les asignen como posibles coincidencias. cuando se dispone de otra evidencia de respaldo. La fiscalía no Mientras que el ajuste de escala utilizado en el estudio actual dio debe considerar que la similitud en ciertos rasgos morfológicos como resultado más falsos rechazos que otros estudios (10,5 % y 8 (puntuación de 2), por sí sola, promueva una gran probabilidad de %) [2,21], debe considerarse en el contexto médico-legal donde las que un acusado sea el objetivo en cuestión, ya que esas consecuencias e implicaciones de aceptar una metodología con una puntuaciones a veces pueden ser falsos positivos. mayor tasa de falsos positivos pueden ser nefastas. Las condenas Independientemente de la iteración, la cohorte de CCTV resultó en injustas de personas inocentes pueden resultar de métodos una proporción desigual de errores, con una tendencia a falsos positivos basados en una alta tasa de falsos positivos, y generalmente se en la iteración indulgente y falsos negativos en la iteración estricta. En la acepta que se debe priorizar una tasa más baja de falsos positivos muestra fotográfica no se encontraron falsos positivos con el análisis en metodologías forenses aceptables y admisibles [43]. estricto y la tasa de falsos negativos persistió en los bajos niveles Más allá de la marcada reducción en las tasas de falsos positivos a expensas de tasas más altas de falsos negativos, la iteración estricta originales (1,61%). En un entorno forense, este es un resultado preferible, ya que es importante errar en el también produjo precisiones brutas más altas (99.9 y 97.3%) y Tabla 9Tabulación de todos los Fotografía a fotografía CCTV a fotografía Sensibilidad (recordar) 0.984 0.884 especificidad 0.998 0.948 Predominio 0.093 0.094 Valor predictivo positivo (PPV) Valor 0.984 0.639 predictivo negativo (NPV) Tasa de 0.998 0.987 detección (DR) 0.091 0.083 Prevalencia de detección (DP) 0.093 0.130 Precisión equilibrada 0.991 0.916 Precisión 0.984 0.639 F1puntaje 0.984 0.742 valores de calidad predictiva calculados a través de la iteración indulgente de los análisis Int J Legal Med Tabla 10Referencia de la tabla de contingencia para la matriz de confusión de la iteración estricta de las comparaciones de fotografía a fotografía analizadas (izquierda), en comparación con las coincidencias perfectas ideales y las exclusiones para la comparación directa del rendimiento de las comparaciones faciales (derecha) coincidencia de cara real Exclusión de cara real Emparejado por el analista PT = 61 FP = 0 Excluido por el analista FN = 1 TN = 608 coincidencia de cara real Exclusión de cara real Combinación perfecta ideal PT = 70 FP = 0 Exclusiones perfectas ideales FN = 0 TN = 608 tp,verdadero positivo;FP,falso positivo;TENNESSE,verdadero negativo;fn,falso negativo;I A,análisis no concluyente lado del acusado para que personas potencialmente inocentes no estén vinculadas a un delito. La coincidencia incorrecta podría deberse a una multitud de factores, incluida la calidad de la imagen, las condiciones fotográficas/de En resumen, en todas las métricas utilizadas para determinar la grabación, la iluminación y la posición de las cámaras. Las imágenes eficacia de MA, quedó claro que MA se desempeñó mejor en el entorno fotográficas utilizadas en el estudio actual, con su resolución mucho más óptimo y estandarizado de las comparaciones de fotografía a fotografía. alta (3456 × 4320 píxeles, 300 y 350 ppp), se consideraron como tales Esto se demuestra por la extremadamente alta precisión, sensibilidad, conducentes a análisis más precisos que la calidad drásticamente especificidad, valores predictivos positivos y negativos identificados (que inferior (358 × 460 píxeles, 96 ppp) CCTV imágenes. En particular, la oscilan entre 0,984 y 0,998). Estos resultados son indicativos de que, a calidad del metraje utilizado en este estudio se consideró de alta pesar de su naturaleza subjetiva, en condiciones ideales, MA es capaz de resolución (>2 megapíxeles) y con una densidad de píxeles muy por identificar coincidencias correctas y rechazar coincidencias falsas con encima del estándar reconocido de aproximadamente 25 ppp requerido una probabilidad muy alta de ser correcta. Sin embargo, cuando se para un análisis facial adecuado [45]. Lee y colegas [2] encontraron toman en consideración imágenes subóptimas, que es a menudo lo que precisiones del 67 % y 67,3 % para evaluadores capacitados y no se les presenta a los analistas forenses de imágenes [44], el desempeño capacitados, respectivamente, al utilizar imágenes de mala calidad para de MA disminuyó. En particular, en la cohorte subóptima de CCTV, se las comparaciones faciales. Esta tasa de aciertos de nivel inferior entre encontró que MA era menos efectivo en el emparejamiento correcto (RA: los expertos y el público enfatiza aún más la necesidad de imágenes de 94,2 %; BA: 91,4 % CCA: 73,6 %) y menos confiable (intraobservador κ = alta calidad, a pesar de la capacitación. Otras investigaciones sobre 0,807 e interobservador κ = 0,743 acuerdo), mientras que es casi faciales basadas en CCTV de mayor calidad en comparación informaron idénticamente capaz de descartar coincidencias incorrectas. El PPV más un 46 % y un 83 % de identificaciones correctas por parte del público y bajo observado destacó la disminución de la probabilidad de que una los expertos, respectivamente [21]. La precisión reportada por Wilkinson coincidencia sea correcta. Dado que la disminución del valor predictivo y Evans [21] para expertos está en un rango similar a las precisiones negativo en la muestra de CCTV es menor en comparación, el efecto reportadas para la muestra de CCTV en el presente estudio, sobre el VPP podría haber sido magnificado por el diseño del estudio y la dependiendo del cálculo de precisión realizado. Además, Wilkinson y organización de la muestra analizada. La muestra se dispuso de modo Evans [21] identificaron que los expertos en análisis facial tenían una que la mayoría de las comparaciones fueran verdaderos negativos, mayor tasa de falsa aceptación (17 %) que de falso rechazo (8 %). Lee et como lo demuestra la prevalencia del 9,4%, que representa el porcentaje al. [2] descubrió que la falsa aceptación en imágenes de CCTV de mala de la muestra que se puede atribuir correctamente como verdadero calidad era dos veces (22,4 %) más probable que un falso rechazo (10,5 positivo. Como resultado, un cambio en cómo se asignan los casos %). Comparativamente, el presente estudio identificó tasas de falsa positivos (verdaderos o falsos) sería más evidente. Curiosamente, el aceptación (falsos positivos) drásticamente más bajas del 0,15 % para la aumento en la prevalencia de detección (0,130), junto con la disminución muestra fotográfica y del 5,22 % para la cohorte de CCTV, y tasas en la tasa de detección (0,083), puede ser indicativo de una mayor variables de falso rechazo (falsos negativos) del 1,43 % para la muestra probabilidad de asignar coincidencias falsas, mientras que en general se fotográfica, y 11,96%, para las cohortes de CCTV. Estos resultados asignan más coincidencias, cuando las condiciones de la imagen son demuestran la importancia de la buena calidad de las imágenes, lo que subóptimas. también ha sido reiterado previamente por otros investigadores, cuando se solicitó el testimonio de expertos. Tabla 11Referencia de la tabla de contingencia para la matriz de confusión de la iteración estricta de las comparaciones de CCTV a fotografía analizadas (izquierda), en comparación con las coincidencias perfectas ideales y las exclusiones para la comparación directa del rendimiento de las comparaciones faciales (derecha) coincidencia de cara real Exclusión de cara real Emparejado por el analista PT = 66 FP = 5 Excluido por el analista FN = 20 TN = 823 coincidencia de cara real Exclusión de cara real Combinación perfecta ideal PT = 86 FP = 0 Exclusiones perfectas ideales FN = 0 TN = 828 tp,verdadero positivo;FP,falso positivo;TENNESSE,verdadero negativo;fn,falso negativo;I A,análisis no concluyente Int J Legal Med Tabla 12Resultados de la función de Fotografía a fotografía CCTV a fotografía Precisión bruta general 0.999 0.973 Intervalo de confianza del 95 % Tasa 0.992–1.000 0,960–0,982 de ausencia de información (NIR) 0.908 0.906 Valor de p (Acc>NIR) < 0.001 < 0.001 Valor p de la prueba de McNemar 1 0.005 Exactitud corregida al azar (CCA) Valor p 99,1% 82,6% (para CCA) < 0.001 < 0.001 matriz de confusión en la iteración estricta de cada cohorte de análisis se considerará admisible para la condena, siempre que las imágenes sean de La muestra de CCTV iluminó a los participantes de manera desigual (Fig. buena calidad [1]. 1). La iluminación desigual comúnmente da como resultado grandes Más allá de la calidad de las imágenes analizadas, la posición de la cámara cambios de contraste en los sujetos grabados [47]. Este cambio de de CCTV también puede haber influido en la capacidad del analista para contraste puede provocar una sobreexposición de los sujetos comparar con precisión los rasgos faciales, ya que se modifican la parte del directamente bajo la fuente de luz y la cámara no puede atenuar la gran rostro que es visible y el ángulo del rostro. Se capturaron fotografías variación de contraste, lo que provoca la pérdida de detalles [47]. En la estandarizadas en un ángulo perpendicular, mientras que el circuito cerrado muestra de CCTV del presente estudio, estos efectos de iluminación de televisión grababa a los participantes desde una mayor altura y con un fueron claramente perceptibles (Fig.1) y afectó la capacidad del analista ángulo de incidencia en torno a los 27°, como ocurre en situaciones de la vida para comparar detalles de manera efectiva. real. El ángulo máximo de incidencia recomendado para la captura de detalles A pesar de estas diferencias en las condiciones de adquisición de faciales en CCTV es de 15° [46]. Este ángulo se recomienda especialmente imágenes, el análisis morfológico funcionó bien, lo que sugiere que porque algunas personas tienden a tener una inclinación natural de la cabeza la variación de las condiciones, dentro de lo razonable, no socava inferior de 15 a 20° al caminar [46]. En el estudio actual, sin embargo, los las comparaciones faciales.11]. Además, independientemente de las participantes se quedaron quietos mirando hacia adelante en las cinco vistas dificultades creadas por las condiciones de adquisición de imágenes capturadas, lo que mitigó la inclinación natural de la cabeza. A pesar de esto, que no coinciden, las posturas faciales o las vistas no parecieron el ángulo de 27° redujo la visibilidad y pudo haber alterado las proporciones afectar el rendimiento del análisis morfológico tanto en fotografías de los rasgos faciales (Fig.1) lo suficiente como para contribuir a la mayor como en CCTV, ya que no se identificaron diferencias en la muestra dificultad en la comparación facial. En la mayoría de las imágenes de CCTV se proporcionada, ya que todos los rostros estaban dispuestos en observó una visibilidad limitada o inexistente de los ojos, independientemente poses coincidentes (es decir, imagen estandarizada lateral izquierda de la vista de la cara, como se identifica generalmente en situaciones con un frente a imagen extraída de CCTV lateral izquierda). Esto parece ángulo de incidencia superior a 15° [46]. sugerir que, a pesar de la gran cantidad de variación en los rasgos faciales expuestos y visibles, se observaron y compararon Además del ángulo y la calidad general de la imagen sin procesar como suficientes rasgos entre imágenes de poses coincidentes. También deficiencias de CCTV en la comparación facial, la iluminación a menudo puede se observó cualitativamente durante el análisis que las ser subóptima para visualizar claramente todas las características faciales. La comparaciones faciales se basaban más en ciertas características, iluminación estandarizada en la muestra fotográfica permitió claras dependiendo de la vista utilizada. Por ejemplo, comparaciones, mientras que la luz natural del sol en la Tabla 13Tabulación de los valores de calidad predictiva calculados a través de la Fotografía a fotografía CCTV a fotografía iteración estricta de cada Sensibilidad (recordar) 0.984 0.767 cohorte de análisis especificidad 1.000 0.994 Predominio 0.093 0.094 Valor predictivo positivo (PPV) Valor 1.000 0.930 predictivo negativo (NPV) Tasa de 0.998 0.977 detección (DR) 0.091 0.072 Prevalencia de detección (DP) 0.091 0.078 Precisión equilibrada 0.992 0.881 Precisión 1.000 0.930 F1puntaje 0.992 0.841 Int J Legal Med Tabla 14Tasas de falsos positivos (FPR) y Fotografía a fotografía tasas de falsos negativos (FNR) calculadas a través de las iteraciones tanto indulgentes como estrictas de las Iteración indulgente de FPR cohortes de análisis iteración estricta FPR 0,16% 0% CCTV a fotografía 5,19% 0,60% Iteración indulgente de FNR 1,61% 11,63% iteración estricta FNR 1,61% 23,26% características comparables, mientras que la boca, la nariz y los ojos (cuando El riesgo de condenas erróneas es una preocupación importante en el sistema eran visibles) fueron los preferidos durante las comparaciones de vista legal. anterior. El efecto de la variación de la pose ha sido ampliamente investigado A pesar de la importancia del enfoque sistemático aconsejado por en el reconocimiento facial basado en computadora como uno de los mayores FISWG y otros [12,24,51], solo un puñado de estudios que investigaron la desafíos a superar, con algunas perspectivas prometedoras para futuras comparación facial desarrollaron, probaron o revisaron listas de investigaciones.48]. Esto es evidente cuando incluso el famoso enfoque de características específicas [24,28,52], con la lista de características más caras propias para el modelado de reconocimiento facial requeriría una detallada y reciente publicada [29] permaneciendo sin probar hasta el inclusión más específica de diferentes puntos de vista [49], una capacidad presente estudio. Un gran beneficio de la lista de características del pensada intrínseca al reconocimiento facial basado en humanos [50]. A pesar FISWG, además de su naturaleza extensa, es la inclusión de descriptores de esta conciencia, ningún otro estudio de comparación facial ha informado para guiar al analista forense en sus esfuerzos, un aspecto que falta en sobre los efectos de varias poses en la identificación facial, específicamente en otros atlas donde las definiciones o los descriptores tienden a ser relación con un enfoque basado en características como el análisis simplistas o asumidos [24,28,52,53]. Algunos de estos estudios morfológico. Como tal, más pruebas en una muestra más grande con informaron principalmente la prevalencia de estas morfologías de consideración de puntos de vista coincidentes y no coincidentes podrían características específicas identificadas dentro de su muestra y limitaron ayudar a confirmar los resultados de este estudio. su discusión a qué características pueden ser más útiles para la discriminación en la comparación facial sin probarlas en ese ámbito En general, se ha informado que la confiabilidad es inconsistente para la comparación facial y las listas de características faciales morfológicas en particular. Una lista de características faciales dignas de mención fue establecida por el FISWG, uno de los grupos de trabajo de la organización de Comités Científicos de Ciencias Forenses, que opera en conjunto con el Instituto Nacional de Ciencia y Tecnología de los Estados Unidos. FISWG está compuesto por expertos que tienen como objetivo guiar la práctica y las técnicas en el campo. Usando la lista de características FISWG, el presente estudio encontró una alta tasa de concordancia en un método de análisis de características puramente morfológico (intraobservador: 93,4% y 80,7% para fotografías y CCTV, respectivamente; interobservador: 92,1% y 74,3% para fotografías y circuito cerrado de televisión, respectivamente). En comparación,28]. Otros indicaron márgenes de error mucho más altos a pesar de las listas detalladas de características morfológicas (error intraobservador: 19 % y error interobservador: 39 %) [24]. Teniendo en cuenta la alta confiabilidad y la disminución de falsos específico (por ejemplo, [47,48]). Un estudio reciente encontró un mejor rendimiento de las tareas de coincidencia de rostros al hacer uso de las instrucciones de rasgos faciales [27]. Aunque los observadores no eran analistas faciales expertos y las instrucciones de características no eran tan extensas como la lista de características del FISWG, se observó un mejor rendimiento al comparar rostros de un grupo de población similar al del observador [27]. Megreya y Bindemann [27] también hizo hincapié en la importancia de la selección de características específicas que pueden aumentar la precisión sobre otras, citando las cejas como una característica particularmente beneficiosa para observar, más que los ojos y los oídos. Se informaron hallazgos similares en una investigación sobre comparaciones directas característica por característica [26]. Según Towler y colegas [26], las comparaciones faciales usando características produjeron mayores precisiones con analistas forenses capacitados, hasta una discriminación de identidad casi perfecta cuando se consideraron las puntuaciones agregadas de múltiples analistas. El enfoque más estricto empleado en el presente estudio pretendía alinearse con el principio legal de presunción de inocencia que un gran número de territorios reconocidos por las Naciones Unidas respetan en los procesos penales (Artículo 11, positivos encontrados en el presente estudio, se puede presentar un Declaración Universal de Derechos Humanos de las Naciones argumento sólido para el uso de una lista de características faciales al realizar Unidas y Artículo 14 (2) Pacto Internacional de Derechos Civiles). La MA. Esta recomendación está de acuerdo con estudios recientes que resaltan ley sudafricana también respeta constitucionalmente este principio la importancia de que los observadores experimentados usen un enfoque (sección 35(3)(h) de la Constitución de la República de Sudáfrica de sistemático, basándose en una lista de características consistente en todos los 1996). Mantener la presunción de inocencia es una preocupación análisis, para lograr un alto nivel de confiabilidad en la comparación facial [24, creciente, ya que muchas industrias y gobiernos están 51]. Establecer un enfoque preciso y confiable para la comparación facial es considerando el despliegue de sistemas de reconocimiento facial primordial para disminuir la semiautomáticos, con tasas deliberadamente altas de falsos Int J Legal Med positivos [54–56] y prejuicios raciales [57,58]. Para mitigar la gran Conclusión cantidad de errores de falsos positivos a los que son propensos estos sistemas, será crucial confiar en un método basado en un observador humano con una tasa baja de falsos positivos durante la selección de partidos como método de contingencia. La prevención de conclusiones falsas positivas es una cuestión de gran relevancia ética, ya que una coincidencia falsa puede dar lugar a que personas inocentes sean acosadas o condenadas [58]. Como tal, se recomienda la iteración estricta cuando los datos de vigilancia son la única evidencia disponible, para evitar condenas injustas. Sin embargo, en circunstancias en las que se dispone de evidencia de respaldo adicional, la iteración indulgente todavía se considera de gran valor para contribuir a construir un caso sólido. La falta de información sobre la validación del análisis morfológico en la literatura es comprensible si se tiene en cuenta la complejidad de diseñar un estudio verdaderamente representativo. Un desafío importante encontrado en este y otros estudios similares se relaciona con la accesibilidad y disponibilidad de imágenes faciales coincidentes de calidad apropiada para permitir pruebas de comparación facial. Si Este es el primer estudio que prueba la lista de características del FISWG para FFC en una muestra grande, dentro de un contexto actualizado, centrándose específicamente en la precisión que se puede obtener al usar esta lista de características. Se encontraron precisiones excelentes a través de condiciones de prueba óptimas y subóptimas, con un alto nivel de confiabilidad. Se identificaron tasas bajas de falsos positivos, lo que sugiere que el uso del análisis morfológico es preciso, confiable y tiene un bajo riesgo de acusación falsa cuando lo aplican analistas experimentados en condiciones óptimas. Se identificó un aumento notable de falsos negativos cuando solo se consideraban positivas las coincidencias con el nivel más alto de confianza. Sin embargo, es probable que este sea un sacrificio aceptable, ya que prevenir condenas injustas por pecar de precavido se considera generalmente una práctica más aceptable en el contexto judicial. bien existen muchas bases de datos, la mayoría son inconsistentes en sus procedimientos y calidad de captura de imágenes, al mismo tiempo Con los resultados predominantemente buenos, superando a los que tienen iteraciones limitadas o números de participantes incluidos de la mayoría de los otros estudios que no utilizaron listas de (por ejemplo, [59–61). El presente estudio se basó en la base de datos características faciales [2,21], se puede hacer un fuerte argumento Wits Face creada a propósito [30] con múltiples individuos conocidos para justificar el uso de un análisis morfológico basado en listas de coincidentes, que se presta bien para probar la comparación facial características en el contexto judicial, con el fin de reducir la debido a su estandarización. Además, el requisito de organizar una serie subjetividad. Como tal, se recomienda confiar principalmente en el de grupos de personas ciegas que incluyan múltiples participantes es análisis morfológico, basado en una extensa lista de características, una tarea laboriosa que requiere una participación externa al emplear la comparación facial en el contexto médico legal. Esta independiente. Es necesario crear grupos de rostros ciegos para evitar recomendación se da con la condición de que no debe ser sesgar a los analistas y para evitar que se familiaricen con los rostros considerada como la única prueba. Es imperativo utilizar más controlando la cantidad de veces que un analista está expuesto a ellos. pruebas de apoyo que puedan asociarse con un análisis facial para Es necesario controlar el exceso de familiarización, ya que los rostros la condena. Esto es particularmente importante en circunstancias familiares son intrínsecamente procesados de manera diferente por los en las que los análisis se consideran no concluyentes, a pesar de humanos [62–64] y no sería una prueba verdaderamente representativa cierto nivel de similitud (morfológica u holística). de la comparación facial forense. La familiarización generalmente no se Para evitar condenas erróneas, se deben considerar discute en los estudios que investigan la comparación facial, ya que iteraciones estrictas del análisis como la práctica preferida, generalmente no se consideran los límites de tiempo o la exposición para mitigar el riesgo de falsos positivos. La iteración más limitada a las muestras faciales (por ejemplo, [2,28,58]). Sin embargo, en indulgente solo debe usarse cuando se dispone de otra la mayoría de los estudios de esta naturaleza, varios analistas revisan las evidencia de respaldo. Aunque se encontró una tasa más alta mismas fotografías, lo que limita la preocupación por la familiarización de falsos negativos usando el enfoque más estricto, se puede (por ejemplo, [2,21]). argumentar que este enfoque sigue siendo beneficioso cuando se usa para la exclusión en imágenes de menor calidad para El análisis morfológico también es un proceso que requiere eliminar posiblemente a posibles sospechosos. Una aplicación mucho tiempo, y el análisis promedio generalmente requiere más modelo estricta también se alinea mejor con los estándares de 2 h [sesenta y cinco], lo que hace más complejo el proceso de forenses necesarios para la admisibilidad de la evidencia y los control de la exposición. Esto es particularmente problemático derechos humanos fundamentales. cuando se considera que realizar comparaciones faciales durante períodos prolongados de tiempo, al ser una tarea extensa y repetitiva, puede dificultar gravemente la precisión de los analistas [ 66]. Todos estos son factores que deben tenerse en cuenta no solo al diseñar estudios que investiguen la precisión de la identificación facial, sino también para garantizar un enfoque científico firme de los estudios de identificación craneofacial.11]. Información suplementariaLa versión en línea contiene material complementario disponible enhttps://doi.org/10.1007/s00414-021-02512-3. AgradecimientosAgradecemos a todos los participantes que aceptaron ser fotografiados y grabados para el desarrollo de la base de datos Wits Face a partir de la cual se compusieron las muestras de grupos de rostros. Un agradecimiento especial también a Joshua Davimes por sus contribuciones instrumentales en Int J Legal Med desarrollando la base de datos Wits Face. También estamos especialmente agradecidos con Tamara Lottering por su ayuda en la composición de los grupos de caras y con Gideon LeRoux por su ayuda en la captura y extracción Disponibilidad de códigoNo aplicaInformación suplementariaLa versión en línea contiene material complementario disponible enhttps://doi. org/ 10.1007/s00414-021-02512-3. de las grabaciones de CCTV de los sistemas de seguridad de la Universidad. También se agradece a los voluntarios que ayudaron en el reclutamiento de participantes: Jesse Fredericks, Kiveshen Pillay, Rethabile Masiu, Sameerah Sallie, Daniel Munesamy, Laurette Joubert, Jordan Swiegers, Betty Mkabela, Johannes P. Meyer, Amy Spies, Natasha Loubser, Nicole Virgili , Dan-Joel Lukumbi, Tamara Lottering, Mathabatha Ntjie, Claudia Landsman, Raheema Dalika, Merete Goosen, Stephanie Souris, Rabelani Negota, Mahlatse Mahasha y Jessica Manavhela. Contribución del autorConceptualización: Nicholas Bacci, Maryna Steyn y Nanette Briers. Metodología: Nicholas Bacci, Maryna Steyn, Nanette Briers y Tobias Houlton. Análisis e investigación formales: Nicholas Bacci y Tobias Houlton. Redacción (preparación del borrador original): Nicholas Bacci. Redacción (revisión y edición): Nicholas Bacci, Maryna Steyn, Nanette Briers y Tobias Houlton. Adquisición de fondos: Nicholas Bacci, Maryna Steyn y Nanette Briers. Recursos: Maryna Steyn y Nanette Briers. Supervisión: Maryna Steyn y Nanette Briers. FondosEl estudio actual se realizó con el apoyo de la Fundación Nacional de Investigación de Sudáfrica (NRF) y la Beca JJJ Smieszeck de la Facultad de Ciencias Anatómicas de la Universidad de Witwatersrand (DAAD-NRF y los fondos de la Beca JJJ Smieszeck otorgados a N. Bacci (Grant No .: 11858) y fondos NRF otorgados a N. Briers como parte de la Mejora de metodologías y prácticas en identificación craneofacial (Concesión No.: CSUR160425163022; UID: 106031). Todas las opiniones, hallazgos y conclusiones o recomendaciones expresadas en este estudio son aquellas de los autores y, por lo tanto, la NRF y la Universidad de Witwatersrand, Johannesburgo, no aceptan ninguna responsabilidad al respecto. Referencias 1. Davis JP, Valentine T, Wilkinson C (2012) Comparación de imágenes faciales. En: Wilkinson C, Rynn C (eds) Identificación craneofacial, 1.ª ed. Cambridge University Press, Nueva York, págs. 136–153 2. Lee WL, Wilkinson C, Memon A, Houston K (2009) Coincidencia de caras desconocidas de metraje de circuito cerrado de televisión (CCTV) de mala calidad: una evaluación del efecto del entrenamiento en la capacidad de identificación facial. AXIS Online J Cent Anat Hum Identificador 1:19–28 3. Jain AK, Klare B, Park U (2012) Coincidencia y recuperación de rostros en aplicaciones forenses. IEEE Multimed 19:20–27.https://doi.org/10.1109/ MMUL.2012.4 4. Phillips PJ (2011) Mejora de la tecnología de reconocimiento facial. Computadora (Long Beach California) 44: 84–86.https://doi.org/ 10.1109/MC.2011.87 5. Urbanová P (2016) Rendimiento de algoritmos de coincidencia basados en la distancia en la identificación facial 3D. Egipto J Forensic Sci 6:135–151. https:// doi.org/10.1016/j.ejfs.2016.04.004 6. Davis JP, Valentine T, Davis RE (2010) Análisis fotoantropométricos asistidos por computadora de imágenes faciales de rostro completo y de perfil. Ciencia forense Int 200: 165–176.https://doi.org/10.1016/ j.forsciint. 2010.04.012 7. Heyer R, Semmler C (2013) Sesgo de confirmación forense: el caso de la comparación de imágenes faciales. J Appl Res Mem Cogn 2:68–70. https://doi.org/10.1016/j.jarmac.2013.01.008 Disponibilidad de datos y materialLos conjuntos de datos analizados durante el estudio actual no están disponibles públicamente debido a la naturaleza sensible de la base de datos Wits Face. La base de datos tiene el identificador.https://doi.org/ 10.17605/OSF. IO/Q8V2R. Una muestra de la base de datos (que consiste en una de 8. Caple J, Stephan CN (2016) Una nomenclatura estandarizada para la antropometría craneofacial y facial. Int J Legal Med 130: 863–879. https://doi.org/10.1007/s00414-015-1292-1 9. Kleinberg KF, Vanezis P, Burton AM (2007) Fracaso de la antropometría las imágenes y grabaciones faciales del autor) está disponible enhttps:// como técnica de identificación facial utilizando fotografías de alta hdl.handle.net/10539/29924. Se aplican restricciones para acceder a la base de datos calidad. J Forensic Sci 52:779–783.https://doi.org/10.1111/j.1556- o parte de ella, que se utilizó bajo licencia para el estudio actual y, por lo tanto, no está disponible públicamente. El acceso está limitado a solicitud formal y aprobación condicional por parte del Comité de Colecciones de la Facultad de Ciencias Anatómicas, estrictamente para investigación no comercial. 4029.2007.00458.x 10. Moreton R, Morley J (2011) Investigación sobre el uso de la fotoantropometría en la comparación de imágenes faciales. Ciencia forense Int 212: 231–237.https://doi.org/10.1016/j.forsciint.2011.06.023 11. Stephan CN, Caple JM, Guyomarc'h P, Claes P (2019) Una descripción general de los últimos avances en imágenes faciales. Ciencia forense Declaraciones Aprobación ética y consentimiento para participarEl estudio fue aprobado incondicionalmente por el Comité de Ética de Investigación Humana (Médico) de la Universidad de Witwatersrand, Johannesburgo. Número de certificado de autorización de ética: M171026. Todos los participantes incluidos en el estudio firmaron un consentimiento informado otorgando a los autores el uso de sus datos. Consentimiento para publicaciónNo se publica información ni fotografías de los participantes como parte del estudio, según lo acordado en el consentimiento informado antes mencionado firmado para la participación. Conflicto de interesesLos autores declaran no tener conflicto de intereses. Res 4:10–28.https://doi.org/10.1080/20961790.2018.1519892 12. Grupo de trabajo científico de identificación facial (2019) Resumen de comparación facial y pautas metodológicas. Disponible en:https:// fiswg.org/ fiswg_facial_comparison_overview_and_methodology_guidelines_V1.0_20191025.p 13. Houlton TMR, SteynM (2018) Encontrar a Makhubu: una comparación facial forense morfológica. Ciencia forense Int 285: 13–20.https://doi. org/ 10.1016/J.FORSCIINT.2018.01.022 14. Steyn M, Pretorius M, Briers N et al (2018) Comparación facial forense en Sudáfrica: estado de la ciencia. Ciencia forense Int 287: 190–194.https://doi.org/10.1016/J.FORSCIINT.2018.04.006 15. Burton AM, Wilson S, Cowan M, Bruce V (1999) Artículo de investigación evidencia de vigilancia de seguridad. Psychol Sci 10:243–248. https://doi.org/10.1111/1467-9280.00144 16. Bruce V, Henderson Z, Newman C, Burton AM (2001) Coincidencia de identidades de rostros familiares y desconocidos captados en imágenes de CCTV. Int J Legal Med J Exp Psychol Appl 7:207–218.https://doi.org/10.1037//1076898X.7.3.207 17. Burton AM, Wilson S, Cowan M, Bruce V (1999) Reconocimiento facial en video de mala calidad: evidencia de vigilancia de seguridad. Psicología Sci 10:243–248.https://doi.org/10.1111/1467-9280.00144 18. Henderson Z, Bruce V, Burton AM (2001) Coincidencia de rostros de ladrones capturados en video. Appl Cog Psychol 15:445–464.https:// doi.org/10.1002/acp.718 19. Megreya AM, Burton AM (2008) Coincidencia de rostros con fotografías: desempeño deficiente en la memoria de testigos presenciales (sin la memoria). j Exp Psychol Appl 14:364–372.https://doi.org/10.1037/a0013464 20. Megreya AM, Memon A, Havard C (2012) El efecto del pañuelo en la cabeza: evidencia directa del paradigma de identificación de testigos presenciales. Appl Cog Psychol 26:308–315.https://doi.org/10.1002/acp.1826 21. Wilkinson C, Evans R (2009) ¿Los expertos en análisis de imágenes faciales son mejores que el público en general para identificar personas a partir de imágenes de CCTV? Justicia científica 49: 191–196.https://doi.org/10.1016/ 37. Dietterich TG (1998) Pruebas estadísticas aproximadas para comparar algoritmos de aprendizaje de clasificación supervisada. Computación neuronal 10: 1895– 1923.https://doi.org/10.1007/978-3-319-50926-6_6 38. Norris C, McCahill M, Wood D (2004) Editorial. El crecimiento de CCTV: una perspectiva global sobre la difusión internacional de la videovigilancia en espacios de acceso público. Vigilancia Soc 2:110–135. https://doi.org/ 10.24908/ss.v2i2/3.3369 39. Edmond G (2013) ¿Solo verdad? Aplicar cuidadosamente la historia, la filosofía y la sociología de la ciencia al uso forense de imágenes de CCTV. Stud Hist Philos Sci Parte C Stud Hist Philos Biol Biomed Sci 44: 80– 91.https://doi.org/10.1016/j.shpsc.2012.09.004 40. Bromby M (2003) ¿A su valor nominal? New Law J Expert Witn Suppl 28:302–303 41. Dewhurst SA, Hay DC, Wickham LHV (2005) Distinción, tipicidad y experiencia de recuerdo en el reconocimiento facial: un análisis de componentes principales. Psychon Bull Rev 12: 1032–1037.https:// doi.org/10.3758/BF03206439 de Glasgow. Behav Res Methods 42:286–291.https://doi.org/10.3758/ 42. Lee K, Byatt G, Rhodes G (2000) Efectos de caricatura, distinción e identificación: prueba del marco del espacio facial. Psicología Sci 11:379–385.https://doi.org/10.1111/1467-9280.00274 BRM.42.1.286 43. Thompson WC, Taroni F, Aitken CGG (2003) Cómo la probabilidad de un j.scijus. 2008.10.011 22. Burton M, White D, McNeill A (2010) La prueba de coincidencia de rostros 23. Megreya AM, Bindemann M, Havard C (2011) Diferencias de sexo en la identificación de rostros desconocidos: evidencia de tareas de emparejamiento. Acta Psychol (Amst) 137: 83–89.https://doi.org/10.1016/ j.actpsy.2011. 03.003 24. Ritz-Timme S, Gabriel P, Obertovà Z et al (2011) Un nuevo atlas para la evaluación de rasgos faciales: ventajas, límites y aplicabilidad. Int J Legal Med 125:301–306.https://doi.org/10.1007/ s00414-010-0446-4 25. Ritz-Timme S, Gabriel P, Tutkuviene J et al (2011) Evaluación métrica y morfológica de los rasgos faciales: un estudio sobre tres poblaciones europeas. Ciencia forense Int 207:239.e1-239.e8. https://doi.org/10.1016/j.forsciint.2011.01.035 26. Towler A, White D, Kemp RI (2017) Evaluación de la estrategia de comparación de características para la identificación forense de rostros. J Exp Psychol Appl 23:47–58.https://doi.org/10.1037/xap0000108 27. Megreya AM, Bindemann M (2018) Las instrucciones de características mejoran la precisión de la coincidencia de rostros. PLoS Uno 13:1–16.https://doi.org/10. 1371/diario.pone.0193455 falso positivo afecta el valor de la evidencia de ADN. J Forensic Sci 48:2001171.https://doi.org/10.1520/jfs2001171 44. Gibelli D, Obertová Z, Ritz-Timme S et al (2016) La identificación de personas vivas en imágenes: una revisión de la literatura. Pierna Media 19:52–60. https:// doi.org/10.1016/j.legalmed.2016.02.001 45. Damjanovski V (2014) CCTV de la luz a los píxeles, 3.ª ed. Elsevier, Oxford 46. Ward D (2013) Prueba de la altura de la cámara frente a la calidad de la imagen. Pensilvania, EE. UU. Disponible en:https://ipvm.com/reports/ testing-camera-height 47. Cohen N, Gattuso J, MacLennan-Brown K (2009) Manual de requisitos operativos de CCTV. Subdivisión de Desarrollo Científico del Ministerio del Interior. Sandridge, Reino Unido Disponible en:https://activos. publishing.service.gov.uk/government/uploads/system/uploads/ aptached_data/file/378443/28_09_CCTV_OR_Manual2835.pdf 48. Zhang X, Gao Y (2009) Reconocimiento facial a través de la pose: una revisión. Reconocimiento de patrón 42:2876–2896.https://doi.org/10.1016/j.patcog. 2009.04.017 28. Porter G, Doran G (2000) Una técnica anatómica y fotográfica para la identificación facial forense. Ciencia forense Int 114: 97–105. https://doi.org/10.1016/S0379-0738(00)00290-5 49. Burton A, Bruce V, Hancock PJB (1999) De los píxeles a las personas: un 29. Grupo de trabajo científico de identificación facial (2018) Lista de funciones de 50. Bruce V (1994) Estabilidad de la variación: el caso del reconocimiento facial comparación de imágenes faciales para el análisis morfológico. Disponible en: https://fiswg.org/FISWG_Morph_Analysis_Feature_List_v2.0_ 20180911.pdf modelo de reconocimiento de rostros familiares. Cog Sci 23:1–31. https://doi. org/10.1016/S0364-0213(99)80050-0 The MD Vernon Memorial Lecture. QJ Exp Psychol Sect A 47:5– 28. https://doi.org/10.1080/14640749408401141 51. Davis JP, Maigut A, Forrest C (2019) La sabiduría de la multitud: un caso de 30. Bacci N, Davimes J, Steyn M, Briers N (2020) Base de datos de rostros Wits. Wits Repos Institucionales. Reinar. DSP, entradahttps://hdl.handle.net/ 10539/29924 31. Steyn M, Smith JR (2007) Interpretación de estimaciones de estatura antemortem en sudafricanos. Ciencia forense Int 171: 97–102.https:// doi.org/10.1016/j.forsciint.2006.10.006 32. Speckeis C (2011) ¿Se puede validar ACE-V? J Forensic Identif 61: 201– 209 Disponible en:https://www.ncjrs.gov/pdffiles1/nij/225329. pdf comparación de rostros post-to-ante-mortem por superreconocedores policiales. Ciencia forense Int 302:109910.https://doi.org/10.1016/ j.forsciint.2019.109910 52. Roelofse MM, Steyn M, Becker PJ (2008) Identificación con foto: rasgos morfológicos y métricos faciales en hombres sudafricanos. Ciencia forense Int 177: 168–175.https://doi.org/10.1016/j.forsciint. 2007.12.003 53. Vanezis P, Lu D, Cockburn J et al (1996) Clasificación morfológica de rasgos faciales en hombres adultos caucásicos basada en una evaluación de 33. R Core Team (2020) R: un lenguaje y entorno para la computación estadística. Disponible en:https://www.r-project.org/ 34. Watson PF, Petrie A (2010) Análisis de acuerdo de métodos: una revisión de fotografías de 50 sujetos. J Ciencias Forenses 41:13998J. https://doi.org/ 10.1520/jfs13998j 54. Dodd V (2018) El uso de la tecnología de reconocimiento facial por parte de la policía del la metodología correcta. Teriogenol 73:1167–1179.https://doi. org/ Reino Unido fue un fracaso, dice el informe. Guardia. Disponible en:https:// 10.1016/j.theriogenology.2010.01.003 www.theguardian. com/uk-news/2018/may/15/uk-police-use-of-facial- 35. Kuhn M (2008) Construcción de modelos predictivos en R usando el paquete caret. J Stat Softw 28:1–26.https://doi.org/10.18637/jss.v028. i05 36. KuhnM (2020) Caret: paquete R de entrenamiento de clasificación y regresión. Disponible en:https://cran.r-project.org/package=caret recognitiontechnology-failure 55. Press Association (2018) La policía galesa identifica erróneamente a miles como posibles delincuentes. Guardia. Disponible en:https://www. theguardian.com/uk-news/2018/may/05/welsh-police-identificar erróneamente a miles de delincuentes potenciales Int J Legal Med 56. Wall M (2019) ¿Sesgado y equivocado? Tecnología de reconocimiento facial en el muelle. Noticias de la BBC 1–12. Disponible en:https://www.bbc.com/news/ business-48842750 57. Grother P, Ngan M, Hanaoka K (2019) Prueba de proveedor de reconocimiento facial, parte 3: efectos demográficos. Gaithersburg, MD.https://doi.org/10. 6028/NIST.IR.8280 58. Morrison R (2019) La tecnología de reconocimiento facial 'racista' utilizada en las fuerzas del orden, la banca y las escuelas identifica erróneamente a los afroamericanos y asiáticos 100 veces más que a los blancos, según muestra un estudio. Correo diario en línea. Disponible en:https://www. dailymail.co.uk/sciencetech/article-7811779/Massive-errorsfacialrecognition-tech-US-study.html 59. Belhumeur PN, Jacobs DW, Kriegman DJ, Kumar N (2013) Localización de partes de rostros usando un consenso de ejemplares. IEEE Trans Pattern Anal Mach Intel 35:2930–2940.https://doi.org/10. 1109/TPAMI.2013.23 60. Burgos-Artizzu XP, Perona P, Dollar P (2013) Estimación robusta de puntos de referencia faciales bajo oclusión. Proc IEEE Int Conf Comput Vis: 1513–1520.https://doi.org/10.1109/ICCV.2013.191 61. Sagonas C, Antonakos E, Tzimiropoulos G et al (2015) 300 Faces In-TheWild Challenge: base de datos y resultados. Imagen Vis Comput 47:3– 18.https://doi.org/10.1016/j.imavis.2016.01.002 62. Ellis HD, Shepherd JW, Davies GM (1979) Identificación de rostros familiares y desconocidos a partir de características internas y externas: algunos Implicaciones para las teorías del reconocimiento facial. Percepción 8: 431– 439. https://doi.org/10.1068/p080431 63. Megreya AM, Burton AM (2006) Las caras desconocidas no son evidencia de caras de una tarea de emparejamiento. Mem Cognit 34:865–876.https://doi.org/ 10.3758/BF03193433 64. Bindemann M, Johnston RA (2017) Comprender cómo las caras desconocidas se vuelven familiares: Introducción a un número especial sobre el aprendizaje de rostros. QJ Exp Psychol 70:859–862.https://doi.org/10.1080/ 17470218.2016.1267235 65. Grupo de trabajo científico de identificación facial (2012) Directrices del FISWG para métodos de comparación facial. Disponible en :https://www. fiswg org / FI SWG _ Pautas para métodos de comparación facial_v1.0_2012_02_02. pdf 66. Alenezi HM, Bindemann M, Fysh MC (2015) Johnston RA (2015) Coincidencia de rostros en una tarea larga: el descanso forzado y el cambio de escritorio no pueden mantener la precisión de la identificación. PeerJ 3:e1184.https:// doi.org/10.7717/peerj.1184 nota del editorSpringer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.