<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	>

<channel>
	<title>Miguel Fernández</title>
	<atom:link href="http://www.miguelfernandez.info/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.miguelfernandez.info</link>
	<description>Blog para el seguimiento de mi actividad investigadora</description>
	<pubDate>Thu, 23 Oct 2008 08:06:29 +0000</pubDate>
	<generator>http://wordpress.org/?v=2.5</generator>
	<language>en</language>
			<item>
		<title>Automatically getting bibliography using existing bibliographic search engines</title>
		<link>http://www.miguelfernandez.info/2008/10/14/automatically-getting-bibliography-using-existing-bibliographic-search-engines/</link>
		<comments>http://www.miguelfernandez.info/2008/10/14/automatically-getting-bibliography-using-existing-bibliographic-search-engines/#comments</comments>
		<pubDate>Tue, 14 Oct 2008 00:19:54 +0000</pubDate>
		<dc:creator>Miguel</dc:creator>
		
		<category><![CDATA[Ideas]]></category>

		<category><![CDATA[Projects]]></category>

		<category><![CDATA[bibliography]]></category>

		<category><![CDATA[retrieval]]></category>

		<category><![CDATA[search engine]]></category>

		<guid isPermaLink="false">http://www.miguelfernandez.info/?p=16</guid>
		<description><![CDATA[Apart from resting for a few weeks, and spending time learning python and django, this Summer I developed an application that lets you retrieve a huge set of research papers from a small set of titles that act as seeds.
Although it&#8217;s just a proof of concept, the application (codenamed Librarian) works really well, and saves [...]]]></description>
			<content:encoded><![CDATA[<p>Apart from resting for a few weeks, and spending time learning <a href="http://www.python.org/">python</a> and <a href="http://www.djangoproject.com/">django</a>, this Summer I developed an application that lets you retrieve a huge set of research papers from a small set of titles that act as seeds.</p>
<p>Although it&#8217;s just a proof of concept, the application (codenamed Librarian) works really well, and saves a lot of time searching for bibliography related to a small set of articles, which is the most common use case when studying the state of the art of a new investigation.</p>
<p>Simplifying a lot, Librarian works as follows:</p>
<p>The user provides the titles of some articles that he has already read, and a lower limit for the size of the set of documents that should be retrieved.</p>
<p>Due to the computational cost of the search, the application presents the user with the URL of a feed, which he will use to track the progress of the request. At the same time, it launches a batch process to actually perform the search.</p>
<p>In each step, the batch process takes the most relevant article from the queue of articles to be processed (initially the seeds) and scrapes  <a href="http://citeseerx.ist.psu.edu/">CiteseerX</a> for citations, and <a href="http://scholar.google.com">Google Scholar</a> for inverse citations and related articles. These references are once more added to the queue of to-be-processed articles, and the process continues until the number of explored articles exceeds the given limit.</p>
<p>The relevance of each article is used to select the next candidate to explore. This is calculated by applying an exponential decay relative to its number of cites with the distance between the article and any of the seeds, where the distance is the number of jumps to get from the seed to the article through intermediate references.</p>
<p>Finally, the outcome of the process is a set of articles that are directly or indirectly related to the seeds, and therefore contains a quite representative sample-of-the-art initially bounded by the articles provided.</p>
<p>Although the results yielded by the tool are not so good as those obtained manually, with a minimum effort and some iterations, you can get excellent results that can save you a lot of work, reducing the time consumed to collect bibliography from days or even weeks, to hours.</p>
<p>&#8211;The article has been proofread with the help of <a title="David's Personal Site" href="http://davidcorrea.info">David Correa</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.miguelfernandez.info/2008/10/14/automatically-getting-bibliography-using-existing-bibliographic-search-engines/feed/</wfw:commentRss>
		</item>
		<item>
		<title>Generación de metadatos a partir de consultas en buscadores (1er Asalto)</title>
		<link>http://www.miguelfernandez.info/2008/06/18/generacion-de-metadatos-a-partir-de-consultas-en-buscadores-1er-asalto/</link>
		<comments>http://www.miguelfernandez.info/2008/06/18/generacion-de-metadatos-a-partir-de-consultas-en-buscadores-1er-asalto/#comments</comments>
		<pubDate>Wed, 18 Jun 2008 15:05:14 +0000</pubDate>
		<dc:creator>Miguel</dc:creator>
		
		<category><![CDATA[Ideas]]></category>

		<category><![CDATA[estrategias de búsqueda]]></category>

		<category><![CDATA[recuperación de información]]></category>

		<guid isPermaLink="false">http://www.miguelfernandez.info/?p=13</guid>
		<description><![CDATA[En la mayor parte de los casos, un documento de la web es alcanzado por sus visitantes a través de un buscador sobre el que se hacen una serie de consultas.
Simplificándolo al máximo, cuando se le hace una consulta a un buscador, éste responde seleccionando de entre todos los documentos que tiene indexados aquellos que [...]]]></description>
			<content:encoded><![CDATA[<p>En la mayor parte de los casos, un documento de la web es alcanzado por sus visitantes a través de un buscador sobre el que se hacen una serie de consultas.</p>
<p>Simplificándolo al máximo, cuando se le hace una consulta a un buscador, éste responde seleccionando de entre todos los documentos que tiene indexados aquellos que contienen uno o más términos de la búsqueda.</p>
<p>Centrémonos ahora en un sólo documento, e imaginemos todas las consultas realizadas por los usuarios cuya intención (inicial o posterior) era encontrarlo. Por ejemplo: imaginemos las consultas realizadas por los usuarios para encontrar un documento que contuviese información acerca del Teide.</p>
<ul>
<li>Volcán Tenerife</li>
<li>&#8220;Pico más alto&#8221; isla &#8220;Gran Canaria&#8221;</li>
<li>Accidentes geográficos Canarias</li>
<li>Montes Tenerife</li>
</ul>
<p>Entre todas las consultas posibles que retornen el resultado deseado, habrá entonces términos que se encuentren en el documento, como Volcán, Tenerife, Accidente geográfico, etc&#8230;, pero habrá otros que no, por ejemplo &#8220;Gran Canaria&#8221;, que puede ser introducido por una persona que realmente busque El Teide, pero que no sepa que no está en Gran Canaria. (El siguiente diagrama ilustra esta idea)</p>
<p><a href="http://www.miguelfernandez.info/wp-content/uploads/2008/06/consultassobredocumentos.png"><img class="alignnone size-full wp-image-14" title="consultas realizadas por los usuarios que alcanzan un determinado documento" src="http://www.miguelfernandez.info/wp-content/uploads/2008/06/consultassobredocumentos.png" alt="consultas realizadas por los usuarios que alcanzan un determinado documento" width="500" height="214" /></a></p>
<p>Sería por tanto interesante, que el buscador tuviese en cuenta aquellos términos que no pertenecen a la bolsa de palabras del documento, pero que son con frecuencia asociados a él.<br />
Los términos de las consultas aportados por cada usuario, formarían parte de la folksonomía del documento.</p>
<p>Para que fuese más útil, la folksonomía podría estructurarse en forma de un grafo cuyos nodos fuesen los términos empleados por los usuarios en las búsquedas, y los arcos representasen una relación semántica entre ellos. Los nodos, además, deberían recoger información tal como su frecuencia de aparición en las búsquedas o su pertenencia o no a la bolsa de palabras del documento (dos medidas de relevancia); los arcos podrían ir etiquetados con el tipo de relación existente entre los términos. La relación semántica entre los términos podría obtenerse de bases de conocimiento existentes, como <a href="http://dbpedia.org/About">DBPedia</a>, o <a href="http://wordnet.princeton.edu/">WordNet</a>; combinadas con el uso de técnicas <a href="http://en.wikipedia.org/wiki/Natural_language_processing"><acronym title="Natural Language Processing / Procesamiento del Lenguage Natural">NLP</acronym></a>,  u otras técnicas basadas en análisis estadístico.</p>
<p>La siguiente figura ilustra parte del grafo de los metadatos asociados al documento que describe El Teide. Los términos de mayor frecuencia se representan con nodos más grandes, los nodos en gris son términos que no pertenecen a la bolsa de palabras del documento:</p>
<p><a href='http://www.miguelfernandez.info/wp-content/uploads/2008/06/grafoetiquetasteido.png'><img src="http://www.miguelfernandez.info/wp-content/uploads/2008/06/grafoetiquetasteido.png" alt="" title="Parte del grafo de los metadatos del documento que describe El Teide" width="381" height="339" class="alignnone size-full wp-image-15" /></a></p>
<p>Con los metadatos generados podríamos servir nuevos resultados ante las entradas del usuario, los resultados contendrían no sólo documentos que incluyesen los términos aportados en la consulta, sino documentos a los que otros usuarios querían referirse cuando hicieron consultas con esos términos. Más aún, las relaciones entre términos permitirían expander la consulta alcanzando nuevos documentos.</p>
<p>Esta idea presenta muchas dificultades, algunas son:</p>
<ul>
<li>Cómo saber cuál es el resultado de la búsqueda que ha satisfecho al usuario, si es que hay alguno</li>
<li>Definir algoritmos concretos para la extracción de las relaciones semánticas entre los términos</li>
<li>Mantener el grafo de metadatos &#8220;limpio de polvo y paja&#8221;, excluyendo aquellos términos que tengan una frecuencia muy baja.</li>
<li>Acotar el alcance de las consultas de manera que no se recuperen documentos con un significado muy distante del que necesitan los usuarios</li>
</ul>
<p>No obstante, <a href="http://en.wikiquote.org/wiki/Einstein">&#8220;En medio de la dificultad, yace la oportunidad&#8221;</a>, por lo que este podría ser un buen filón.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.miguelfernandez.info/2008/06/18/generacion-de-metadatos-a-partir-de-consultas-en-buscadores-1er-asalto/feed/</wfw:commentRss>
		</item>
		<item>
		<title>Excuse Moi: Google Android + 11870.com</title>
		<link>http://www.miguelfernandez.info/2008/06/03/11/</link>
		<comments>http://www.miguelfernandez.info/2008/06/03/11/#comments</comments>
		<pubDate>Mon, 02 Jun 2008 22:13:47 +0000</pubDate>
		<dc:creator>Miguel</dc:creator>
		
		<category><![CDATA[Off-topic]]></category>

		<category><![CDATA[11870]]></category>

		<category><![CDATA[android]]></category>

		<category><![CDATA[movilidad]]></category>

		<category><![CDATA[web 2.0]]></category>

		<guid isPermaLink="false">http://www.miguelfernandez.info/?p=11</guid>
		<description><![CDATA[Acabo de entregar la práctica para la asignatura de Desarrollo de Dispositivos Móviles que cursé esta semana en el máster. Se llama Excuse Moi, y es una aplicación para google Android que haciendo uso del servicio de búsqueda de 11870.com y la API de geolocalización del teléfono es capaz de encontrar negocios que estén cerca [...]]]></description>
			<content:encoded><![CDATA[<p>Acabo de entregar la práctica para la asignatura de Desarrollo de Dispositivos Móviles que cursé esta semana en el máster. Se llama Excuse Moi, y es una aplicación para google <a href="http://code.google.com/android/" title="Sitio web oficial de Android">Android</a> que haciendo uso del servicio de búsqueda de <a href="http://11870.com" title="enlace al sitio de 11870">11870.com</a> y la API de geolocalización del teléfono es capaz de encontrar negocios que estén cerca del dispositivo en tiempo real.</p>
<div style="text-align:center">
<object width="425" height="355"><param name="movie" value="http://www.youtube.com/v/HayzWYVZqOs&#038;hl=en"></param><param name="wmode" value="transparent"></param><embed src="http://www.youtube.com/v/HayzWYVZqOs&#038;hl=en" type="application/x-shockwave-flash" wmode="transparent" width="425" height="355"></embed></object>
</div>
<p>Además se pueden consultar todos los detalles del negocio provistos por 11870.com, hacer llamadas a su teléfono de contacto y situarlos en un mapa junto con nuestra posición. En relación a los mapas, la ruta entre cada negocio y la ubicación del teléfono es rectilínea porque el servicio de rutas de conducción de Android no funciona correctamente en España. De todas formas, espero solucionarlo pronto consultando otro servicio.</p>
<p>Excuse Moi es mi primera aplicación sobre Android, y a excepción del poco soporte que ofrecen aún las herramientas de desarrollo, la verdad que ha sido una experiencia bastante satisfactoria.</p>
<p> En no mucho tiempo, tengo intención de crear una nueva aplicación, a la que se le indiquen unos conceptos de interés y que avise automáticamente cuando el usuario pase cerca de alguno de ellos, sin necesidad de que el usuario interactúe de forma continua con la aplicación. A ver qué tal sale!</p>
]]></content:encoded>
			<wfw:commentRss>http://www.miguelfernandez.info/2008/06/03/11/feed/</wfw:commentRss>
		</item>
		<item>
		<title>Toma de contacto I - Web Semántica.</title>
		<link>http://www.miguelfernandez.info/2008/05/27/toma-de-contacto-i-web-semantica/</link>
		<comments>http://www.miguelfernandez.info/2008/05/27/toma-de-contacto-i-web-semantica/#comments</comments>
		<pubDate>Tue, 27 May 2008 08:06:47 +0000</pubDate>
		<dc:creator>Miguel</dc:creator>
		
		<category><![CDATA[libros]]></category>

		<category><![CDATA[semantic web]]></category>

		<guid isPermaLink="false">http://www.miguelfernandez.info/?p=10</guid>
		<description><![CDATA[Antes de comenzar a recolectar y leer papers estoy leyendo algunos textos introductorios.
He comenzado con un texto sobre Web Semántica, para no ir de vacío y aprovechar mejor el curso que se impartirá en el máster.
El texto es Explorer&#8217;s Guide to the Semantic Web de Manning.
En general el libro no está mal, y presenta de [...]]]></description>
			<content:encoded><![CDATA[<p>Antes de comenzar a recolectar y leer papers estoy leyendo algunos textos introductorios.</p>
<p>He comenzado con un texto sobre Web Semántica, para no ir de vacío y aprovechar mejor el curso que se impartirá en el máster.</p>
<p>El texto es <a title="Vista del libro en Amazon" lang="en" hreflang="en" href="http://www.amazon.com/Explorers-Guide-Semantic-Thomas-Passin/dp/1932394206/ref=sr_1_1?ie=UTF8&amp;s=books&amp;qid=1211874970&amp;sr=8-1">Explorer&#8217;s Guide to the Semantic Web</a> de Manning.</p>
<p>En general el libro no está mal, y presenta de forma introductoria la filosofía, los paradigmas y las tecnologías relacionadas con la Web Semántica.</p>
<p>La pega que le veo, es que es de 2004, y lógicamente cojea en cuanto a ceonceptos y tecnologías que han surgido o se han popularizado después, tales como los relacionados con metadatos embebidos en HTML (RDFa, eRDF, microformatos, GRDDL), o aquellos conceptos que tienen que ver con la capas de superiores del <a title="capas de la web semántica" hreflang="en" href="http://www.w3.org/2004/Talks/0412-RDF-functions/slide4-0.html">layer cake</a>.</p>
<p>Por otro lado, me parece muy interesante la descripción que hace de otros paradigmas para la representación del conocimiento en la web alternativos a RDF, como son los <a title="Entrada en la wikipedia sobre Topic Maps" hreflang="en" href="http://en.wikipedia.org/wiki/Topic_Maps">Topic Maps</a>, que aunque no sean muy populares, tienen un gran potencial de cara a estructurar a indexar conocimiento de manera que éste se pueda encontrar y navegar con facilidad.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.miguelfernandez.info/2008/05/27/toma-de-contacto-i-web-semantica/feed/</wfw:commentRss>
		</item>
		<item>
		<title>Sitio.new</title>
		<link>http://www.miguelfernandez.info/2008/05/21/sitionew/</link>
		<comments>http://www.miguelfernandez.info/2008/05/21/sitionew/#comments</comments>
		<pubDate>Tue, 20 May 2008 22:24:56 +0000</pubDate>
		<dc:creator>Miguel</dc:creator>
		
		<category><![CDATA[Off-topic]]></category>

		<guid isPermaLink="false">http://www.miguelfernandez.info/?p=6</guid>
		<description><![CDATA[Aquí comienza una nueva aventura. Atrás quedó el antiguo sitio, al que siendo sincero no le dediqué la cantidad de tiempo que me habría gustado. Para él un adiós.



]]></description>
			<content:encoded><![CDATA[<p>Aquí comienza una nueva aventura. Atrás quedó el antiguo sitio, al que siendo sincero no le dediqué la cantidad de tiempo que me habría gustado. Para él un adiós.
<p class="aligncenter">
<a href='http://www.miguelfernandez.info/wp-content/uploads/2008/05/antiguositio.jpg'><img src="http://www.miguelfernandez.info/wp-content/uploads/2008/05/antiguositio-300x157.jpg" alt="" title="Captura de pantalla del antiguo sitio." width="300" height="157" class="aligncenter size-medium wp-image-8" /></a></p>
<p>
]]></content:encoded>
			<wfw:commentRss>http://www.miguelfernandez.info/2008/05/21/sitionew/feed/</wfw:commentRss>
		</item>
	</channel>
</rss>
