>_ construit par guillaume & pierre andre · depuis 2020 rejoindre la communauté · PAT — formation sourcing ↗ · Anara ↗
>_freesourcingtools
EN FR
SPECIALIZED

>_names to arxiv

Associe une liste de noms de chercheurs à leurs papiers Arxiv récents — titre, date et lien abstract — pour cerner leurs travaux avant le contact.

G par guillaume
>_ INPUT

l'API Arxiv impose une pause de 3 secondes entre chaque requête. les longues listes prennent du temps — le statut ci-dessus affiche la progression.

>_ OUTPUT
les résultats apparaissent ici.
>_ COMMENT ÇA MARCHE
ÉTAPE 01

Colle des noms de chercheurs

Un par ligne. Format "Prénom Nom" — les accents sont normalisés.

ÉTAPE 02

On interroge Arxiv pour chacun

API publique Arxiv, sans auth. Jusqu'à 10 papiers récents par chercheur, renvoyés avec titre, date et lien vers l'abstract.

ÉTAPE 03

Clique un papier pour lire l'abstract

Chaque résultat pointe vers la page d'abstract arxiv.org. Sers-t'en pour vérifier l'axe de recherche avant de prendre contact.

astuceArxiv a 2-3M de papiers indexés depuis 1991, dominant en physique/maths/info. Pour la bio/médecine, combine avec PubMed (pas encore d'outil FST — recherche manuelle).

Tu as une shortlist de noms — peut-être grattés sur le programme d'une conférence, une page de labo ou l'équipe d'un concurrent — et tu as besoin de savoir sur quoi chaque personne bosse vraiment avant d'écrire le moindre mot. Cadrer un recrutement R&D, ça veut dire lire les papiers. Cet outil transforme une liste brute de noms en une pile de leurs travaux Arxiv récents, pour que tu puisses distinguer le généraliste du deep learning de la personne qui a publié trois papiers sur le problème exact que ton client essaie de résoudre.

Colle les noms un par ligne, FirstName LastName :

Andrej Karpathy
Geoffrey Hinton
Yann LeCun

Lance Search Arxiv et tu obtiens, par chercheur, jusqu'à 10 de ses papiers les plus récents — chaque carte affiche la date de publication, l'ID arxiv: et le titre, avec un lien direct vers la page d'abstract. Clique au travers et tu tiens ton accroche : son résultat le plus récent, avec ses propres mots.

Deux limites honnêtes. D'abord, l'API d'Arxiv impose une pause de trois secondes entre chaque requête, donc une liste de 30 noms prend une minute et demie — la ligne de statut décompte pour que tu saches que ça bosse, pas que c'est bloqué. Ensuite, Arxiv est dominé par la physique, les maths et l'info ; ça remonte à 1991 mais ce n'est pas tout. Pour la biologie ou la médecine, tu auras des résultats maigres ou vides — combine plutôt avec une recherche manuelle sur PubMed. Et le matching se fait sur la chaîne du nom, donc un nom courant peut ramener un homonyme. Scanne les titres avant de faire confiance au match.