
En el “Mar de la Incertidumbre”. En Medicina II.
Jose Davidow
4 jun 2025
La crisis de reproducibilidad. El efecto declinación.
La crisis de la reproducibilidad, o replicación, se refiere a una extraña realidad. Muchos, la mayoría, de estudios científicos, aparentemente sólidos, no son reproducibles. Al hacerse evidente esta realidad, se la ha comenzado a calificar como crisis.
Cuando se intenta repetirlos en la misma forma en que fueron realizados, no se logra el efecto esperado. En algunos casos, se logra con resultados menos notorios, que implican un efecto de declinación.
Algunos, tal vez la mayoría, no serán reproducibles porque no han sido realizados apropiadamente. Un número menor, porque son fraudulentos. Muchas veces, por razones que no se comprenden, misteriosas.
En revistas de alto perfil, la mayoría de los hallazgos publicados son irreproducibles en el 70 al 90 % de los casos.”. (Begley CG, Ioannidis JP., 2015) (2)
La proliferación de estudios no reproducibles es una plaga en tiempos actuales.
El misterio.
En 1999, se publicó en Science, un estudio de John Crabbe y colaboradores, neurocientíficos de la Universidad de Oregón. En él se describe un experimento, realizado simultáneamente, en 3 centros de investigación distintos. Era un intento de evaluar la reproducibilidad o replicación.
Se realizó en Portland, en Albany y en Edmonton. Se evaluaría la respuesta conductual de ratones, a la administración de cocaína.
Se estandarizaron todas las variables del experimento. Los animales eran de la misma especie, provenían del mismo proveedor, fueron enviados el mismo día, en la misma forma, a los tres laboratorios. Se los alojó en jaulas similares, con la misma clase de aserrín en el suelo de la jaula. Se alimentaron con la misma comida. El mismo número de ratones en cada jaula. La intensidad de la luz, y el tiempo de luz y oscuridad se hicieron iguales. Cuando hubo que manipularlos se usó el mismo tipo de guantes. El experimento se realizó a la misma hora en los tres centros, se usaron los mismos instrumentos de medición. Las latitudes de los centros diferían muy poco. Sus climas eran parecidos, con ligeras variaciones. Los resultados deberían ser iguales.
Pero no lo fueron. En dos laboratorios difirieron, pero no mucho. En uno de ellos la diferencia fue enorme. (Crabbe, J. C., Wahlsten, D., & Dudek, B. C. (1999) (1)
En la introducción los autores señalan. “…se evaluaron los animales con una batería de seis aspectos conductuales. Los aparatos, los protocolos y las variables ambientales se hicieron rigurosamente idénticas. A pesar de esto, hubo diferencias sistemáticas en la conducta, en los tres laboratorios”.
La realidad. Las causas no tan misteriosas.
“More than 70% of researchers have tried and failed to reproduce another scientist's experiments, and more than half have failed to reproduce their own experiments. Those are some of the telling figures that emerged from Nature's survey of 1,576 researchers who took a brief online questionnaire on reproducibility in research”
“Mas del 70% de investigadores han tratado y fallado en reproducir los experimentos de otros científicos. Más de la mitad ha fallado en reproducir sus propios experimentos. Esta son las cifras que emergen de una encuesta realizada por Nature, a 1576 investigadores, sobre la reproducibilidad de los estudios”. (Baker, M., 2016) (2)
CG. Begley y J. Ioannidis, expresan en una de sus publicaciones: “En los años recientes, se reconocen con más asiduidad las debilidades que existen en nuestros sistemas actuales de investigación básica y preclínica. En revistas de alto perfil, la mayoría de los hallazgos publicados, no son irreproducibles en el 70 al 90 % de los casos.”. (Begley CG, Ioannidis JP., 2015) (3)
Basándose en observaciones empíricas, estiman estos autores, que las publicaciones irreproducibles, alcanzan ese porcentaje. En todo el espectro de la investigación, en medicina y psicología. Con el agravante de que muchas publicaciones irreproducibles, se dan en revistas de alto perfil.
Como dijimos en el post anterior, investigadores de Bayer, no pudieron replicar 43, de 67 supuestos hallazgos, en investigación cardiovascular y oncológica, reportados en revistas de prestigio.
Antes de avanzar en una posible línea de trabajo, científicos de la empresa Amgen, evaluaron 53 estudios de drogas, considerados innovadores. No pudieron replicar 47 de 53. Estas drogas tenían un efecto potencial para el tratamiento del cancer. Se suponía que algunos podrían no ser totalmente verificables, por describir aspectos muy novedosos. Pero solo 6 de los 53 pudieron ser confirmados. (Begley CG, Ellis LM.,2012) (3) (Begley CG, Ioannidis JP. 2015) (4)
Posibles causas.
La proliferación de estos estudios no reproducibles, que como dijimos, son una plaga en tiempos actuales, se atribuye a varias causas. Además de las misteriosas.
Los investigadores tienen incentivos para producir mucho y rápido. Interesa el número, no la calidad. Se espera que publiquen. Si no publican no se los considera, se los critica, no se los promueve, e incluso pueden perder el trabajo. La academia premia el número. El famoso “publish or perish”
La revisión por pares, que debe determinar la calidad de un estudio, a menudo no es rigurosa. Los editores de las revistas no tienen ideas claras sobre la calidad de lo que publican.
“…Low sample size, small effect sizes, data dredging (also known as P-hacking), conflicts of interest, large numbers of scientists working competitively in silos, without combining their efforts, and so on, may conspire to dramatically increase the probability that a published finding is incorrect…”
“… muestras pequeñas, efectos de baja magnitud, la manipulación de los datos para encontrar patrones que puedan mostrarse como significativos, (p-hacking). Conflictos de interés, científicos que trabajan aislados y no combinan esfuerzos, y otras causas, conspiran para incrementar dramáticamente la probabilidad de que un hallazgo publicado sea incorrecto…” (Munafò MR, Nosek BA, et al., 2017) (5)
¿Autoengaño...?
Los científicos deben estar alertas y abiertos a lo nuevo. Pero al mismo tiempo, deben evitar ser engañados, por la tendencia humana de ver patrones en lo azaroso.
Esta tendencia, que se denomina “apofenia”, más el sesgo de confirmación, que nos lleva a enfocar en aquello que está en línea con nuestra expectativa, nos pueden llevar a falsas conclusiones.
La apofenia (del griego ἀπό, apó, "separar, alejar", y φαίνειν, phaínein, "aparecer, manifestarse como fenómeno, fantasía”), es la experiencia que consiste en percibir patrones, conexiones o ambos, en sucesos aleatorios o en datos aparentemente sin sentido. Este término tiene acepciones diferentes en los ámbitos de la psicología y de la estadística, donde también suele utilizarse.
El término fue acuñado en 1959, por el neurólogo y psiquiatra alemán Klaus Conrad, quien lo definió como «visión sin motivos de conexiones», acompañada de la experiencias de dar sentido a lo que no lo tiene. (Wikipedia (22-03-25)
El sesgo de confirmación o sesgo confirmatorio es la tendencia a favorecer, buscar, interpretar y recordar, la información que confirma las propias creencias o hipótesis, dando desproporcionadamente menos consideración, a posibles alternativas. Se trata de un tipo de sesgo cognitivo y un error sistemático del razonamiento inductivo. (Wikipedia 22-03-25)
Dicen Marcus Munafò y sus colaboradores: “…durante el análisis de los datos puede ser difícil para los investigadores reconocer sus errores, debido a los sesgos de confirmación y de retrospectiva, haciéndolos aceptar resultados que cumplen sus expectativas y rechazando los contrarios”. (Munafò MR, Nosek BA, et al., 2017) (5)
Para John Ioannidis, el problema principal es que, demasiados investigadores persiguen lo que llama, “cazar la significación”.
Encontrar maneras de que los datos alcancen el test de significación, el límite del 95% inventado por Ronald Fisher, (valor de “p”, menor de 0.05). Dice Ioannidis “...los científicos están tan ansiosos de alcanzar ese valor que juegan con los números, tratando de hallar algo que sea válido”
De forma parecida, David Grimes expresa: “...Torturing the data until it confesses: P-Hacking…. The economist Ronald Coase, famously quipped that if you torture the data enough, it will confess to anything. This is certainly true of all biomedical science, with inappropriate statistical analysis lying at the heart of many spurious results, P-Hacking or data dredging”.
“…Torturando los datos hasta que confiesen, El economista Ronald Coase, con humor, decía que, si torturamos los datos lo suficiente, confesarán cualquier cosa. Esto es cierto de las ciencias biomédicas, con análisis estadísticos inapropiados, en el fondo de muchos hallazgos espúreos. (P-hacking or data dredging),” (Grimes DR., 2024) (6)
Formas de desperdiciar esfuerzo y recursos en investigación. Tomado de (Grimes, 2024) (6)
El dragado de datos, (data dredging, también conocido como espionaje de datos o p-hacking, es el uso indebido del análisis de datos para encontrar patrones en los datos, que puedan presentarse como estadísticamente significativos, aumentando y subestimando así dramáticamente, el riesgo de información falsa positiva. Esto se hace realizando muchas pruebas estadísticas sobre los datos, y solo informando aquellas que arrojan resultados significativos. (Wikipedia 1-03-25)
Otro mecanismo para alcanzar resultados a cualquier costo, es el llamado “HARKing”.
HARKing. Este es un acrónimo de “Hypothesizing After the Results are Known”. Presentar hipótesis post-hoc, en la introducción de un estudio, como si hubieran sido formuladas antes de obtener los datos. Mientras que p-hacking, trata de que los datos conformen la hipótesis, HARKing simplemente busca una hipótesis, que vaya bien con los datos.(Wikipedia 1-03-25)
Un estudio de K.D. Cobey y colaboradores, evalúa la opinión de investigadores en ciencias biomédicas sobre el tema de la reproducibilidad de los resultados. Observan que el 72% de los encuestados concuerdan en que hay una crisis de reproducibilidad en la medicina. (Cobey KD, Ebrahimzadeh S, et al., 2024) (6),
La causa percibida como la más importante es la “presión para publicar”, (publish or perish), quien publica poco, puede perder su lugar de trabajo.
Efecto “Declinación”.
Se dice que ha ocurrido el “efecto declinación”, cuando el resultado de un estudio que parecía altamente positivo, se demuestra como de menor impacto, o eficacia, cuando se repite.
Quien lo observa, probablemente por primera vez, para su desconcierto, es J.B. Rhine.
John Banks Rhine, trabajaba en la Universidad de Duke, y había desarrollado interés en la parapsicología. Utilizaba las cartas de Zener, para evaluar la “percepción extrasensorial”.
Sus sujetos solían mostrar resultados sugerentes de percepción extrasensorial. Adivinaban unas cartas con figuras simples, llamadas cartas de Zener.
Las cartas de Zener fueron creadas en la década de 1930, por el psicólogo Karl Zener y el parapsicólogo Joseph Banks Rhine, en la Universidad de Duke, EE. UU. Diseñadas para investigar habilidades psíquicas como la telepatía y la clarividencia, estas cartas constan de un mazo de 25, con cinco símbolos distintos: círculo, cruz, ondas, cuadrado y estrella. Cada símbolo aparece cinco veces. Rhine usó las cartas en experimentos para probar la percepción extrasensorial (ESP), pidiendo a los participantes que adivinaran el símbolo de una carta oculta. ( fuente Grok)
La mayoría de los sujetos adivinaban un 10 a 12%, de las veces. Otros acertaban con mayor frecuencia. Un estudiante, llamado Adam Linzmayer, lograba adivinar las figuras, el 50% de las veces.
En algunas oportunidades adivinaba todas las figuras. Esto excedía ampliamente la posibilidad del azar. Varias veces Linzmayer demostró esta característica. Rhine estaba convencido de la percepcion extrasensorial.
Pero luego, al repetir los ensayos, Linzmayer y otros participantes destacados, comenzaron a perder esa capacidad y terminaron con resultados similares a otros menos capaces, el mero azar. Rhine llamó a esta situacion, “efecto declinacion”. No está claro por qué Linzmayer y otros perdieron su talento.
Para quienes piensen que Rhine no estaba en sus cabales, pueden ver el estudio publicado en Nature: "Information transmission under conditions of sensory shielding" (Nature, October 18, 1974, 251, 5476, pages 602–607) (8). Los autores fueron Russell Targ y Harold E. Puthoff, y el estudio se realizó en el Stanford Research Institute. Es desconcertante.
A pesar de las críticas, Rhine es reconocido como el "padre de la parapsicología moderna" por su esfuerzo en establecerla como disciplina científica. Sus métodos estadísticos y el uso de las cartas Zener siguen siendo referentes en el campo. La Parapsychological Association y el Rhine Research Center continúan su legado.
J.B. Rhine en un experimento con las cartas de Zener. (Francis Wickware - Dr. Rhine and ESP. Life Magazine. April. 15, 1940)
The Truth wears off.
En un interesante ensayo, Jonah Lehrer, en el New Yorker, sugestivamente titulado: "The Truth wears off, ¿is there something wrong with the scientific method?”, (La Verdad se apaga con el tiempo, ¿hay algo equivocado en el método científico...?). se refiere extensamente al efecto declinación, y menciona varios ejemplos de este fenómeno.
Entre ellos, menciona el entusiasmo con que se recibió la aparición de los nuevos antipsicóticos, como risperidona, olanzapina o quetiapina en los inicios de los años 90.
En una conferencia en Bruselas, en 2007, un grupo de psiquiatras e investigadores, comentaban con sorpresa, que dichos beneficios parecían estar desvaneciéndose. Sostenidas por varios estudios randomizados, Seroquel, Abilify y Zyprexa fueron “best seller,” para las empresas productoras.
Pero en esta conferencia surgía que, con el correr de los años, no parecían superiores a los más antiguos, que venían en uso desde la década de los 50. Y su proclamada falta de efectos secundarios, era inexistente. Sus virtudes parecían estar desvaneciéndose. Algún experto llegó a decir que “eran peores”. (Lehrer, J. 2010) (9)
Los antipsicóticos atípicos, (de segunda generación), no demostraron ser claramente superiores a los típicos, según estudios de la época, como CATIE y CUtLASS, que destacaron beneficios marginales, contrarrestados por riesgos metabólicos.
Ahora asistimos al nacimiento de otro grupo de drogas antipsicóticas, cuyo futuro tal vez sea el mismo, como Lumateperone, Cariprazine, Bexpiprazole, y otros.
En una publicación en JAMA, John Ioannidis, se refiere a la existencia de efectos que, en subsiguientes estudios son contradichos, o cuyos efectos supuestos, son inferiores a los inicialmente descriptos.
“… de 49 estudios clínicos originales frecuentemente citados, 45 aseveraban que la intervención era efectiva. De estos, 7 (16%) fueron posteriormente refutados. Otros 7 (16%) al ser repetidos, los efectos fueron de menor cuantía”.
Concluye:
“Efectos posteriormente negados, o inicialmente más notables, no son raros en investigaciones frecuentemente citadas. Las controversias son más frecuentes en estudios no randomizados, pero aún muy citados ensayos randomizados, pueden ser refutados, en especial aquellos con bajo número de casos estudiados”. (Ioannidis JP.,2005) (10)
Toda clase de efectos, supuestamente confirmados, parecen ser inciertos. Es como si los datos perdieran su cualidad de verdaderos.
Establecidos como verdades en los textos, pasan a ser improbables. Los textos envejecen, y los datos improbables continúan en ellos. Este fenómeno, dice Lehrer, no tiene aún un nombre mejor que el de "declinación".
Aparece en muchas disciplinas, desde la psicología a la ecología, y es notable en ciencias biomédicas. (Lehrer, J. 2010) (9)
Entre otros. Lehrer refiere los siguientes.
En la década del 90, J.W. Schooler, observó un efecto psicológico interesante, un hecho nuevo, con respecto al lenguaje y la memoria. Se creía en esa época, que el acto de describir un recuerdo, mejoraba la capacidad de volver a recordarlo. Por medio de inteligentes experimentos, Schooler demostró que sujetos a los que se les mostraba una cara y se les pedía que la describieran, eran menos capaces de reconocer esa figura, si se les mostraba tiempo despues.
Llamó a este fenómeno, “ensombrecimiento verbal”. Su trabajó mereció gran interés. (Schooler, J. W., & Engstler-Schooler, T. Y. (1990) (11)
Schooler se hizo conocido, fue citado numerosas veces. Luego extendió este concepto a otros aspectos de la memoria, como el recuerdo del sabor de un vino, de un perfume, o de otras cosas.
Con el tiempo comenzó a sorprenderse y a dudar, como otros muchos investigadores, intentaba y no conseguía reproducir sus experimentos.
Repasando su método y su análisis de los datos, no podía encontrar una falla. El efecto se hacía más y más débil al ser reproducido. Finalmente intentó evaluar este fenómeno de declinación, realizando otros experimentos, sin encontrar una explicación razonable al fenómeno. Terminó por llamarlo, “habituación cósmica”, en similitud a que, sometidos a cualquier estimulo, nos habituamos y tendemos a dejar de percibirlo. El universo se habitúa y deja de manifestarse en ciertas cosas.
Golondrina Común, (Hirundo rustica).
En 1991 el zoólogo danés Anders Moller, hizo un descubrimiento relacionado con las golondrinas, la simetría y la reproducción. Se sabe desde hace mucho tiempo, que la asimetría corporal, indica una mayor carga de mutaciones en el genoma.
Moller creyó descubrir que las golondrinas hembra, elegían a los machos más simétricos para reproducirse. Esto sugería que las hembras utilizaban la simetría como una forma de determinar la buena genética del macho.
Publicó su hallazgo en Nature, y despertó una fiebre de investigaciones similares, extendiéndose a otras especies e incluso a la especie humana. (Møller, A. P. (1992) (12)
En los años posteriores numerosos estudios confirmaron este hallazgo, en distintos modelos. Se dijo que las mujeres tenían mejores orgasmos con hombres simétricos. Supuestamente, por esa percepción de la salud genética. (Aunque podría explicarse de otras maneras).
Luego la teoría empezó a desplomarse, en 1994, de catorce estudios publicados solo ocho confirmaron esta idea. En 1995, cuatro de 8 publicaciones. En 1998, de 12 estudios solo tres encontraron la relación esperada. El efecto parecía disminuir, entre 1992 y 1997 la magnitud del efecto se redujo en un 80%.
¿Sesgo de publicación?
Este fenómeno de la declinación ha sido atribuido, a falta de mejores explicaciones, al sesgo de publicación.
Los científicos, y las revistas científicas, tienen tendencia a publicar hallazgos positivos. No encontrar efectos, hallazgos negativos, no generan demasiado interés, y no se publican.
Hay una ola de entusiasmo inicial, ante el hecho nuevo, y el fenómeno se traslada a los textos. Pasado el tiempo repeticiones del mismo son negativas, se comienza a cuestionar. El interés por cuestionar crece, repeticiones van negando el efecto.
Pero, lamentablemente, el dato sigue en los textos, por mucho tiempo. Y se lo sigue citando, en otras publicaciones. para la confusión general.
Que investigadores serios no consigan, con sus mejores esfuerzos, reproducir sus propios hallazgos. no termina de explicarse.
Pareciera que la “habituación cósmica”, opera en algún sentido.
Josef Škoda, clínico, profesor de la universidad de Viena, fue uno de los precursores de la medicina moderna. Difundió el uso de la auscultación y la percusión en medicina. Fue además, podemos decir, el creador de la dermatología.
Recuerdo haber leído de Škoda, que era escéptico de los fármacos de la época, afirmar irónicamente, “hay que apresurarse a utilizar los nuevos medicamentos antes de que pierdan su efecto.”
Joseph Škoda (1805-1881), médico, profesor y dermatólogo checo.
En medicina esta situación es particularmente preocupante. Aunque muchas ideas generan resultados conflictivos y sus efectos parecen disminuir, se persiste en ellas por mucho tiempo.
Son ideas que parecen ciertas. Que parecen tener sentido. Y no queremos dejar de lado.
Dice Lehrer: “… y este es el motivo por el cual el efecto declinacion, es tan preocupante. No porque revele la falibilidad de la ciencia humana, en la cual los datos son retocados, y nuestras creencias determinan lo que percibimos.
Tampoco porque nuestras más exitosas teorías sean modas pasajeras, que pronto seran rechazadas. El efecto declinacion es preocupante, porque nos recuerda lo dificil que es probar algo. Aunque tengamos una idea que es verdadera, probarla puede ser muy difícil. Y una idea que ha sido probada en un experimento, puede ser falsa”
(Lehrer, J. 2010) (9). Ver tambien, (Jennions, Michael & Moller, Anders, 2002) (13)
Estudios fraudulentos.
“La mala conducta en la investigación significa: fabricación, falsificación o plagio.
Al proponer, realizar o revisar una investigación, o al informar los resultados de la investigación.
Fabricación: consiste en inventar datos o resultados, registrarlos o informarlos.
Falsificación: es manipular materiales, equipos o procesos de investigación, o cambiar u omitir datos o resultados, de manera que lo investigado no se represente con precisión en el registro de la investigación.
Plagio: es la apropiación de las ideas, procesos, resultados o palabras de otra persona sin dar el crédito apropiado”. (George SL, Buyse M., 2015) (13)
La frecuencia con la cual algunos científicos fabrican o falsifican datos es materia de controversia. Se han realizado algunas encuestas, preguntando a investigadores acerca del tema. Las respuestas son variables, pero sugieren que el fenómeno existe
Existe un número difícil de determinar de estudios irreproducibles fraudulentos. En los que se han falsificado los datos, o los resultados, o se han construido de la nada. Un reporte de auditoria en el Reino Unido revela que serían un 0.40% de los evaluados.
En los primeros 10 años de estudio, de la Oficina de Integridad en la Investigación, (Office of Research Integrity), se detectaron 136 casos, 36 de ellos en ensayos clínicos. (George SL, Buyse M., 2015) (14)
El investigador de la Universidad de Edimburgo, Daniele Fanelli, en 2009, publicó en PLOS ONE, una revisión sistemática y metaanálisis de numerosas encuestas, realizadas a investigadores, tomadas de la literatura, donde se les preguntaba sobre la fabricación y falsificación de datos.
En el resumen dice; “… un promedio de 1,97% de científicos encuestados admitieron haber fabricado, falsificado o modificado datos o resultados al menos una vez” … y el 33,7% admitió otras formas cuestionables de investigación…”
“… en encuestas sobre la integridad de otros colegas, el 14 % admitieron saber sobre falsificaciones, y el 72% saber sobre otras prácticas inapropiadas…” Estas conductas fueron reportadas con mayor frecuencia, en estudios médicos y farmacológicos. (Fanelli D., 2009) (15)
En el final Fanelli concluye: “However, it is likely that, if on average 2% of scientists admit to have falsified research at least once, and up to 34% admit other questionable research practices, the actual frequencies of misconduct could be higher than this”.
“Finalmente es probable que, si un promedio del 2%, de científicos, admiten haber falsificado sus investigaciones, y el 34% admite otras prácticas inapropiadas, las frecuencias reales de inconductas, pueden ser mayores”.
Son decenas los casos de fraude que han salido a la luz, y es probable que sigan apareciendo, como ejemplos, vayan estos dos:
Bharat Aggarwal (EE. UU.), Distinguished Professor of Cancer Research, en el University of Texas, MD Anderson Cancer Center. Renunció a su cargo, cuando se descubrió que 65 trabajos publicados por él, en el área del tratamiento del cáncer, eran fraudulentos.
Piero Anversa, (EE. UU., Italia), y Annarosa Leri. (EE. UU., Italia), colaboradores e investigadores en la Universidad de Harvard. Fueron hallados culpables de manipular y falsificar datos, en su investigación sobre células madre cardíacas. En octubre de 2018, después de intentar replicar los estudios de Anversa, la Universidad de Harvard solicitó la retractación de 31 de sus publicaciones.
Parte de los estudios fraudulentos provienen de los “paper mills”, y se publican en “revistas predatorias”.
Fábricas de fraudes o “Paper mills”.
Tambien tenemos quienes se ocupan de producir y publicar, estudios de dudosa calidad o fraudulentos, “Paper Mills”.
Paper Mill (“Fabrica de estudios”, de “papers”), es una empresa que fabrica y publica estudios falsos que simulan ser verdaderos. Son sofisticadas operaciones que venden la autoría en trabajos de investigación reales. U organizan la redacción, o construcción a demanda, de un manuscrito académico fraudulento.
Cualquier persona puede comprar la autoría de un estudio que le interese. El precio varía si se figura como autor, o coautor. Suelen estar bien hechos y pasar la revisión por pares, de las revistas donde se publican finalmente.
Estas empresas proporcionan servicios adicionales, búsquedas de coautores, bibliografía, envío de manuscritos a diferentes revistas. Si la revista es prestigiosa y acepta el trabajo, el precio que cobran se incrementa. Hacen revisión y control de lo publicado y su indexación en las bases de datos internacionales La mayoría de estos estudios contienen datos falsos, o son plagios de otros verdaderos.
En mayo de 2024, el The Wall Street Journal, reveló un escándalo de estudios falsos, que afectó a la editorial John Wiley & Sons. Como resultado, se retiraron más de 11.300 artículos, y se cerraron 19 revistas. Los artículos problemáticos estaban relacionados con Hindawi, una editorial egipcia, de unas 250 revistas científicas. Wiley había comprado Hindawi en el 2021. Estos trabajos falsos provenían de “paper mills”
La primera evidencia de la venta de autoría, fue reportada aparentemente en Science en 2013. (Hvistendahl M., 2013) (16)
En el 2018, Jana Christopher publica en FEBS Letter, otra de las primeras observaciones acerca de estudios que parecían mostrar datos poco convincentes, aparentemente fabricados. (Christopher J (2018) (17)
Diferentes estimaciones consideran que el 2 al 20% de trabajos publicados son fraudes. El problema es más destacado en temas de biomedicina. (Else H, Van Noorden R., 2021) (18)
Esta industria ha crecido exponencialmente. Alrededor de 400.000 publicaciones entre el 2000 y el 2022 parecen mostrar características de ser producidas en paper mills. (Van Noorden R., 2023) (19)
Estos trabajos seudocientíficos, ingresan en la vasta masa de las investigaciones. Superan la escasa capacidad existente de detectarlos. Mas de 100.000 artículos se publican por semana, más de 6 millones por año.
Analizando estudios originados en paper mills y retractados, se observa que tienden a citarse entre ellos. (Candal-Pedreira C, Ross JS, et al. 2022) (20)
De la vasta masa de estos fraudes, solo alrededor de 50.000, habrían sido retractados, según el sitio Retraction Watch. (Joelving F., 2024) (21)
Investigaciones recientes han revelado que los paper mills, sobornan a editores de revistas legítimas, para garantizar la publicación de artículos fraudulentos, lo que complica aún más la detección. (Abalkina A, Aquarius R., et al. 2025) (22)
Anna Abalkina, investigadora de la Universidad de Berlín, publica un estudio en el 2023, donde relata la existencia y las características de un paper mill ruso. Resumo algunos datos del mismo. (Abalkina, Anna, 2023). (23)
“…International Publisher Ll C. Es un paper mill. Un sitio web que anuncia más de 10.000 manuscritos en busca de un autor. Su catálogo abarca desde la metalurgia de aleaciones de aluminio, hasta las peculiaridades biológicas de las codornices. Los posibles compradores exploran títulos y resúmenes, vislumbrando la clasificación esperada en la base de datos Scopus. Los investigadores solo deben seleccionar un título y pagar una tarifa. Luego, seleccionan un puesto de autor, con costos que oscilan entre los 500 y los 3.000 dólares. Su dirección es uno de los modernos rascacielos del Moscow International Business Center, Moscú, Rusia”
Revistas predatorias.
John Bohannon, es un periodista científico, publicó en Science su experiencia con algunas revistas de acceso abierto, “predatorias”. Creó un supuesto estudio, donde describía un posible agente anticancerígeno. Falso y con errores evidentes.
Envió el articulo a 304 revistas de acceso abierto, más de la mitad lo aceptaron.
El estudio, dice Bohannon. tenía graves y obvios errores, que deberían haber motivado su inmediato rechazo, por los editores o por los pares revisores. Pero el 60% de estas revistas lo aceptaron. (Bohannon, J. , 2013) (25)
Dice Bohannon: “…From humble and idealistic beginnings, a decade ago, open access scientific journals have mushroomed into a global industry, driven by author publication fees rather than traditional subscriptions. Most of the players are murky. The identity and location of the journals’ editors, as well as the financial workings of their publishers, are often purposefully obscured.”
“…De sus humildes e idealistas comienzos, hace una década, las revistas científicas de acceso abierto, han crecido hasta transformarse en una industria global, sostenida con lo que pagan los autores de lo publicado, en lugar de las tradicionales suscripciones. La mayoría son turbias. La identidad y la residencia de sus editores, y las finanzas de quienes las publican, son oscuras”.
Una “revista predatoria o depredadora”, es una publicación académica con un modelo de negocios, que implica cobrar a los autores cargos por procesamiento de artículos. Se les atribuye no comprobar la calidad y la legitimidad de los textos.
Son de acceso abierto. Es decir, cobran por publicar. Ofrecen información falsa sobre sus objetivos, no son transparentes. Desconocen el sistema de revisión por pares, o lo falsifican. Sus consejos editoriales suelen ser personajes desconocidos, o inventados. Pueden calcular su factor de impacto en forma inadecuada, para prestigiarse.
Se las denomina predatorias, porque algunos científicos, podrían ser engañados acerca de su seriedad, publicando de buena fe. Otros, conociendo la calidad dudosa, publicarán igualmente.
Jeffrey Bealls, de la Universidad de Colorado, fue el primero en señalar la existencia de estos sitios y acuñó el término “predatorias”. Fue criticado y discutido. La universidad de Colorado, eliminó su página, donde listaba numerosas revistas sospechosas. Las razones son inciertas.
Los paper mills y los predatory journals, son fenómenos que han emergido en el ámbito de la publicación científica. Representan una amenaza significativa para la integridad de la investigación médica, contribuyendo a la incertidumbre en la evidencia científica.
Ambos fenómenos, introducen datos no fiables en la literatura, lo que puede llevar a decisiones clínicas basadas en información errónea en la práctica médica.
Existen muchas revistas serias con un sistema de pago por publicación, (gold open access). Su existencia favorece la difusión del conocimiento. Pese a ello se crea un conflicto de intereses, ya que podrían aceptar artículos para maximizar ingresos, sin importar la calidad de los mismos.
Los predatory journals, suelen aprovecharse de investigadores de países de ingresos bajos o medios, donde el acceso a revistas de prestigio es limitado y la presión para publicar es alta.
La cultura académica de "publish or perish", empuja a los científicos, especialmente en países en desarrollo o noveles, a recurrir a estas prácticas para cumplir con requisitos de promoción o financiamiento.
Un artículo de 2015, publicado en BMC Medicine, por Cenyu Shen y Bo-Christer Björk, reporta un aumento significativo, en el número de artículos publicados en revistas depredadoras. Estiman que, en 2014, se publicaron alrededor de 420,000 artículos, en unas 8,000 revistas depredadoras, frente a aproximadamente 53,000 en 2010. (Shen C, Björk BC.,2015) (25)
Tras el cierre de la lista de Beall en 2017, hay varias alternativas para identificar revistas predatorias y evaluar la calidad de las publicaciones académicas entre ellas: Cabell's Predatory Reports, Stop Predatory Journals y Retraction Watch.
Conclusiones.
Navegamos el Mar de la Incertidumbre, en Medicina. Debemos estar alertas.
Como dice dice Jonah Lehrer: “… y este es el motivo por el cual el efecto declinacion, (agrego, el efecto declinacion y todo lo otro expresado en estos posts), es tan preocupante. No porque revele la falibilidad de la ciencia humana, en la cual los datos son retocados, y nuestras creencias determinan lo que percibimos.
Tampoco porque nuestras más exitosas teorías sean modas pasajeras, que pronto seran rechazadas. El efecto declinacion es preocupante, porque nos recuerda lo dificil que es probar algo. Aunque tengamos una idea que es verdadera, probarla puede ser muy difícil. Y una idea que ha sido probada en un experimento, puede ser falsa”
“…Aunque tengamos una idea que es verdadera, probarla puede ser muy difícil. Y una idea que ha sido probada en un experimento, puede ser falsa”
Referencias II.
1. Crabbe, J. C., Wahlsten, D., & Dudek, B. C. (1999). Genetics of mouse behavior: Interactions with laboratory environment. Science, 284(5420), 1670-1672.
2. Baker, M. 1,500 scientists lift the lid on reproducibility. Nature 533, 452–454 (2016). https://doi.org/10.1038/533452a
3. Begley CG, Ellis LM. Drug development: Raise standards for preclinical cancer research. Nature. 2012 Mar 28;483(7391):531-3. doi: 10.1038/483531a. PMID: 22460880.
4. Begley CG, Ioannidis JP. Reproducibility in science: improving the standard for basic a
REFERENCIAS
To add a video to your site, click the “Insert” button and navigate to the “Media” section. Then, drag and drop a video component onto the Canvas.