Skip To Content

Usar consultas de texto de búsqueda de Lucene

El Geoportal usa un sofisticado motor de búsqueda que proporciona varias opciones de búsqueda, opciones de clasificación, rendimiento rápido y extensibilidad, y que se basa en el motor de búsqueda de código abierto Lucene de Apache. Para obtener más información sobre cómo aprovechar de manera específica la sintaxis de búsqueda de Lucene para realizar búsquedas eficientes en el Geoportal, consulte el sitio web de Lucene.

Para aprovechar al máximo la página de búsqueda del Geoportal, consulte las siguientes secciones para obtener una lista de entidades que proporciona Lucene para la sintaxis de búsqueda:

Términos

Una consulta se divide en términos y operadores. Existen dos tipos de términos: términos sencillos y frases. Un término sencillo es una sola palabra, como contaminación o atmosférica. Una frase es un grupo de palabras entre comillas dobles, como "contaminación atmosférica". Se pueden combinar varios términos juntos con operadores booleanos para formar una consulta más compleja. A continuación se muestran algunos ejemplos de términos de búsqueda:

  • Al buscar la palabra contaminación, se obtienen 35 resultados (elementos que contienen la palabra contaminación).
  • Al buscar atmosférica, se obtienen 123 resultados (elementos que contienen la palabra atmosférica).
  • Al buscar contaminación atmosférica (sin comillas), se obtienen 148 resultados (elementos que contienen las palabras contaminación o atmosférica, o ambas).
  • Al buscar contaminación AND atmosférica, se obtienen 10 resultados (elementos que contienen ambas palabras: contaminación y atmosférica).
  • Al buscar "contaminación atmosférica" (entre comillas), se obtienen 7 resultados (elementos que contienen las palabras contaminación y atmosférica una justo detrás de la otra).
  • Al buscar title:contaminación, se obtienen 5 resultados (elementos que contienen la palabra contaminación en el título).
  • Al buscar title:atmosférica, se obtienen 14 resultados (elementos que contienen la palabra atmosférica en el título).
  • Al buscar +title:contaminación +title:atmosférica o title:"contaminación atmosférica", se obtienen 2 resultados (ambos elementos contienen las dos palabras: contaminación y atmosférica en el título).

Caracteres especiales

El Geoportal es compatible con caracteres especiales separados que son parte de la sintaxis de la consulta. A continuación se muestra una lista de caracteres especiales y sus códigos de escape:

Carácter especialCódigo de escape

+

\+

############################################################-

\-

&&

\&\&

||

\|\|

!

\!

(

\(

)

\)

{

\{

}

\}

[

\[

]

\]

^

\^

"

\"

~

\~

*

\*

?

\?

:

\:

\

\\

Por ejemplo, para buscar elementos a escala 1:250.000, use la consulta: 1\:250.000.

Campos

Lucene es compatible con los datos de campos. Cuando realiza una búsqueda, puede especificar un campo o usar el campo predeterminado. Los nombres de los campos y el campo predeterminado son de implementación específica. Puede buscar cualquier campo escribiendo el nombre de campo seguido por dos puntos y el término que busca. Buscar un campo específico en la consulta puede ser más exacto que solo buscar con términos. Tome en cuenta que algunos campos distinguen entre mayúsculas y minúsculas. Recuerde que ciertos caracteres especiales se deben marcar en la consulta usando un carácter de barra invertida (\) o encerrarlos entre comillas ("") cada vez que formen parte del texto de búsqueda. A continuación se muestra una lista de búsquedas con campos:

  • title:"El camino correcto" AND text:"no seguir por aquí"
  • uuid:"{550E8400-E29B-41D4-A716-446655440000}"
  • uuid:\{550E8400\-E29B\-41D4\-A716\-446655440000\}
  • resource.url:"http://server.arcgisonline.com/ArcGIS/rest/services/ESRI_StreetMap_World_2D/MapServer"
Nota:

El campo solo es válido para el término al que precede directamente, por lo que la consulta title:Hágalo bien solo buscará la palabra Hágalo en el campo de búsqueda.

Búsquedas con comodines

El Geoportal admite búsquedas con comodines de un único carácter o varios caracteres en términos sencillos (no dentro de consultas de frases).

Precaución:

No es posible utilizar un asterisco (*) ni un signo de interrogación (?) como el primer carácter de una búsqueda.

Para realizar una búsqueda con comodines de un solo carácter, use el signo de interrogación. La búsqueda con comodines de un solo carácter busca términos que coincidan con el término que reemplazó el carácter sencillo. Por ejemplo, para buscar casa o caja, puede usar la búsqueda ca?a.

Para realizar una búsqueda con comodines de varios caracteres, use el asterisco. Las búsquedas con comodines de varios caracteres buscan 0 o más caracteres. Por ejemplo, para buscar mar, mares o marinero, puede usar la búsqueda mar*. También puede usar las búsquedas con comodines en la mitad de un término, por ejemplo, ma*r.

Búsquedas aproximadas

El Geoportal es compatible con las búsquedas aproximadas que se basan en la Distancia de Levenshtein o en el algoritmo de Distancia de edición. Para realizar una búsqueda aproximada, use el carácter "~" (virgulilla) al final de un término sencillo. Por ejemplo, para buscar un término que se escriba de forma parecida a casa, use la búsqueda aproximada: casa~. Esta búsqueda encontrará elementos que contengan no solo palabras como casa y casaca, también términos como caso. El Geoportal admite especificar la similitud requerida. El valor está entre 0 y 1. Si el valor está más cerca de 1, solamente se harán coincidir los términos con mayor similitud, por ejemplo, casa~0,8. El valor predeterminado es 0,5 si no se especifica ningún valor.

Búsquedas por proximidad

El Geoportal permite buscar palabras que estén dentro de una distancia específica. Para realizar una búsqueda por proximidad, use el carácter "~" (virgulilla) al final de una frase. Por ejemplo, para buscar en un documento contaminación y atmosférica en una distancia no superior a 10 palabras una respecto de la otra, use la búsqueda "contaminación atmosférica"~10.

Búsquedas de rango

El Geoportal admite consultas de rango de búsquedas de sobre y de marca de hora. Esto permite que el usuario pueda hacer coincidir documentos cuyos valores de campo estén entre los límites inferior y superior especificados por la consulta de rango. Las consultas de rango pueden ser inclusivas o exclusivas de los límites superior e inferior.

Búsquedas de sobre

La sintaxis de una búsqueda de sobre consta del nombre de campo (sobre) seguido de dos puntos (:) y una definición de rango inclusivo o exclusivo. En el caso de los rangos inclusivos, encierre el sobre espacial entre corchetes ([ ]) y, para los rangos exclusivos, encierre el sobre espacial entre llaves ({ }). Las búsquedas de rango exclusivo solo seleccionan recursos que quedan exactamente dentro del rango de sobre especificado, mientras que las búsquedas de rango inclusivo buscan recursos seleccionados que se intersecan y quedan fuera del rango especificado. El primer par de valores lo forman las coordenadas de la esquina inferior izquierda seguidas de la palabra clave TO (en mayúsculas) y, después, las coordenadas de la esquina superior derecha. Las coordenadas siempre se dan en el sistema de proyección WGS 1984 (4236). También es posible usar comodines en lugar de una sola coordenada o un par completo de coordenadas de esquina, por ejemplo, envelope:[*,-70 TO +30,*] o envelope:{-80,-70 TO *}.

A continuación se muestra una lista de búsquedas de sobre:

  • envelope:[-80,-70 TO +30,+70]

    Esta búsqueda devolvería los documentos en los que un sobre espacial se interseca con unas coordenadas de delimitación suroeste de -80° O y -70° S y unas coordenadas de delimitación noreste de 30° O y 70° N.

  • envelope:{-80,-70 TO +30,+70}

    Esta búsqueda devolvería los documentos que quedan exactamente dentro del rango de un sobre espacial con unas coordenadas de delimitación suroeste de -80° O y -70° S y unas coordenadas de delimitación noreste de 30° O y 70° N.

Búsquedas de marca de hora

La sintaxis de una búsqueda de marca de hora consta del nombre de campo (dateModified) seguido de dos puntos (:) y una definición de rango inclusivo.

  • A continuación se muestra una lista de ejemplos de búsqueda de marca de hora:
    • dateModified:[2009-10-11 TO 2009-11-10]

      Esta búsqueda devolvería recursos con un valor de dateModified entre 2009-10-11 y 2009-11-10, incluidas las fechas especificadas.

    • dateModified:[2006 TO 2010]

      Esta búsqueda devolvería recursos con un valor de dateModified entre los años 2006 y 2010.

    • dateModified:2009-12

      Esta búsqueda devolvería recursos con un valor de dateModified de diciembre de 2009 (los corchetes no son necesarios).

Incrementar un término

El Geoportal es capaz de especificar el nivel de relevancia de los documentos devueltos con respecto a los términos encontrados. Para dar más importancia a un término, inserte el símbolo de acento circunflejo, ^, junto con un factor de relevancia (un número) al final del término que vaya a buscar. Cuanto más alto sea el factor de relevancia, más importante será el término. Esta función le permite controlar la relevancia de un documento al concederle más importancia a un término concreto. Por ejemplo, si busca contaminación atmosférica y quiere que el término contaminación sea más relevante, otórguele más importancia con esta sintaxis de búsqueda: contaminación^4 atmosférica. Esta búsqueda devolvería documentos en los que el término contaminación aparece como más relevante. También puede dar más relevancia a toda una frase mediante la siguiente sintaxis de búsqueda: "contaminación atmosférica"^4 "contaminación acústica". El factor de relevancia predeterminado es 1. El factor de relevancia puede ser menor que 1, pero es necesario que sea un número positivo, por ejemplo, contaminación^0,2 atmosférica.

Operadores booleanos

Los operadores booleanos permiten que se combinen los términos a través de operadores lógicos. El Geoportal admite estos operadores booleanos:

  • El operador OR es el operador de conjunción predeterminado. Esto quiere decir que, si no hay ningún operador booleano entre dos términos, se utiliza el operador OR. El operador OR vincula dos términos y encuentra un documento coincidente en caso de que alguno de los términos exista en un documento. Esto es equivalente a una combinación por medio del uso de conjuntos. También se puede usar el operador || en lugar de la palabra OR.
  • El operador AND devuelve los documentos en los que aparecen ambos términos en cualquier parte del texto. Este operador es equivalente a una intersección usando grupos. También se puede usar el operador && en lugar de la palabra AND.
  • El operador + exige que el término introducido después del operador + aparezca en algún campo de un documento.
  • El operador NOT excluye los documentos que contengan el término que aparezca después de NOT. Este operador es equivalente a una diferencia usando grupos. El signo de exclamación (!) también se puede usar en lugar de la palabra NOT.
    Nota:

    El operador NOT no se puede usar con un único término.

Nota:

Los operadores booleanos distinguen entre mayúsculas y minúsculas.

Agrupar

El Geoportal es compatible con el uso de paréntesis para agrupar cláusulas para formar subconsultas. Puede resultar útil si desea controlar la lógica booleana para una consulta. Por ejemplo: contaminación AND (atmosférica OR acústica) devolverá los documentos que contengan las palabras contaminación y atmosférica o las palabras contaminación y acústica.

Agrupación de campo

El Geoportal es compatible con el uso de paréntesis para agrupar varias cláusulas en un campo individual. Por ejemplo: title:(atmosférica OR acústica) encuentra elementos que contengan las palabras atmosférica o acústica en el título.