Busca: Centraliza, integra y facilita la búsqueda de datos de contratos y contratistas públicos. Monitorea los procesos de contratación y alerta sobre posibles riesgos de corrupción.
Informate: Estudia los procesos de contratación pública, incluyendo el marco legal, las políticas en curso, su implementación y resultados. Además, ofrece recomendaciones basadas en los hallazgos de sus evaluaciones.
Para lograr la integración de datos públicos, Sembrando Sentido ha desarrollado un sistema de información que recolecta datos de una serie de registros públicos, comenzando con la Consulta de Contratos de la Oficina del Contralor de Puerto Rico. Utilizando una serie de scrapers programados en Python y apoyándose en librerías como BeautifulSoup para la extracción de datos y RapidFuzz para el procesamiento de coincidencias, el sistema identifica y extrae información sobre contratistas desde el Registro de Corporaciones del Departamento de Estado, el Registro de Donantes Políticos del Contralor Electoral, el Registro de Cabilderos y el Registro de Beneficiarios de Decretos Contributivos .
Estos scrapers automatizan la navegación y la extracción de datos de los sitios web, para luego procesarlos y emparejarlos con información de otros registros. Es crucial identificar al contratista en el Registro de Corporaciones. Si se encuentra una coincidencia única en dicho registro, los datos generales se extraen e integran en nuestra base de datos. En caso de múltiples coincidencias o si no se encuentra ninguna, el sistema emplea algoritmos de coincidencia fuzzy para intentar identificar la corporación correcta. Esta fase difiere para contratistas individuales, ya que no figuran en el Registro de Corporaciones y, por lo tanto, cuentan con menos información adicional.
En los casos donde el sistema no logra identificar la corporación, el equipo y los voluntarios de Sembrando Sentido realizan una investigación manual exhaustiva para encontrar la correspondencia entre registros de corporaciones e individuos. Además, el sistema clasifica a las entidades según tipos (como agencias gubernamentales, corporaciones, individuos, etc.) utilizando parámetros desarrollados para facilitar su análisis. Para el emparejamiento en los registros de Donantes Políticos, Cabilderos y Beneficiarios de Decretos Contributivos, el sistema compara los nombres de los contratistas o sus oficiales con los nombres registrados en los respectivos registros. Si encuentra una coincidencia exacta (excluyendo el segundo nombre), el sistema extrae la información y etiqueta el contrato como 'Donante', 'Cabildero' o 'Beneficiario' en la base de datos.
Este sistema crea una base de datos que integra, centraliza y enriquece los datos, facilitando su presentación y análisis.
La versión beta de Contratos En Ley, es sólo el comienzo para fomentar la información pública clara, completa, accesible e integrada. Actualmente, estamos trabajando para desarrollar evaluaciones de contrataciones públicas rigurosas, crear un monitor de contratos, y expandir el buscador para que pueda extraer datos públicos descentralizados en sobre 56 portales de gobierno.
Laboramos para compartir más información, hacerla completamente pública y estandarizar la misma según el Open Contracting Data Standard. También trabajamos un API para aquellos que soliciten acceso directo a nuestra base de datos.
En ningún momento, el scraper accede información confidencial, manipula los datos expuestos, o busca generar ningún tipo de daño en los Registros Públicos mencionados o la data expuesta en los mismos. Los datos que se extraen originan de, y se mantienen como están expuestos en los Registros Públicos mencionados sin realizar cambios a los mismos. No somos la fuente oficial u original de los mismos, y los datos pueden contener errores u omisiones no detectados, al igual que equivocaciones en el pareo de los datos.
Por esta razón, no podemos garantizar la calidad de la data que se presenta, pero si ofrecemos un mecanismo para reportar errores, y nos ponemos a disposición de verificarlos y de presentar correcciones según sea posible. Aun así, al no poder garantizar la calidad de la data presentada, el usuario decide consumir la data a su propio riesgo.
No somos ni nos hacemos responsables de daños o pérdidas de ningún tipo, a consecuencia del uso de los datos públicos presentados. Además, aunque contamos con un sistema de seguridad robusto, no podemos garantizar que los servidores de nuestro sistema no puedan ser afectados por viruses o intervenciones indebidas, que afecten la data o la continuidad del Buscador en algún momento.
Nuestro objetivo es hacer que la información sobre los contratistas públicos y los procesos de contratación pública estén más completos e integrados, y ampliamente disponibles. Sin embargo, debemos asegurarnos de continuar brindando el servicio en beneficio de todes, por lo que debemos establecer ciertas restricciones en el uso del sitio.
La ausencia de un archivo robots.txt no significa que permitamos el scraping arbitrario, ya que el mismo, puede presentar una carga excesiva a nuestros servidores. Si nuestro sistema rastrea actos sospechosos, como intentos de hackeo o a consecuencia de daños creados por un usuario, se podría prohibir el uso de nuestro Buscador en algunas circunstancias. Si usted desea adquirir acceso directo a todos los datos en nuestra base de datos, favor de contactarnos: imasses@sembrandosentido.org.
Obtenemos la información en nuestras bases de datos del gobierno y otras fuentes a través de una variedad de medios que incluyen: directamente desde sitios web gubernamentales y APIs, hasta integración de datos disponibles públicamente o mediante solicitudes de información. Dedicamos mucho tiempo, esfuerzo e incluso dinero para obtener estos datos y convertirlos en un recurso viable y altamente utilizable. No reclamamos ningún derecho sobre los datos que recibimos de las fuentes gubernamentales, y los atribuimos siempre que sea posible. No obstante, sí reclamamos derechos sobre las evaluaciones que llevamos a cabo y respeto sobre los mismos.
Agradecemos citar la información sobre nuestra plataforma o evaluaciones, cuando algún trabajo se apoye directamente del trabajo de Contratos En Ley. El trabajo del Sembrando Sentido, a través de su proyecto Contratos En Ley, está protegido por las leyes de propiedad intelectual de Puerto Rico y por una licencia de Creative Commons. Para cualquier pregunta o solicitud, escríbenos: imasses@sembrandosentido.org.