Crawling af jobannoncer til jobnet.dk og workindenmark.dk
Styrelsen for Arbejdsmarked og Rekruttering (STAR) udvikler og drifter to jobportaler:
— jobnet.dk (Jobnet), der har udviklet sig til en af Danmarks største jobportaler med dagligt mere end 14 000 aktive jobannoncer.
— workindenmark.dk (WIDK), der indeholder mere end 1 000 jobannoncer rettet mod virksomheder, der søger udenlandsk arbejdskraft.
På Jobnet har arbejdsgivere mulighed for at oprette jobannoncer enten via jobnet.dk eller via webservicen JobAd. Derudover opdateres portalernes job-database med job, der er crawlet fra danske hjemmesider, herunder både virksomheders hjemmesider og andre jobportaler.
STAR har indgået aftale med Ankiro om levering af jobannoncer til de 2 portaler. Aftalen omfatter daglige leverance af jobannoncer kl. henholdsvis 8 og 14. Aftalen med Ankiro udløber i august 2016, og der er således tale om genudbud af opgaven.
Overordnet har STAR følgende krav til løsningen:
— Der skal 2 gange dagligt leveres aktuelle, dansksprogede jobannoncer crawlet fra danske hjemmesider og portaler vedrørende job i Danmark til opdatering af Jobnets database.
— Der skal 2 gange dagligt leveres engelsksprogede jobannoncer crawlet fra danske hjemmesider og portaler vedrørende job i Danmark til opdatering af WIDK's database.
— Løsningen skal fange en så stor andel som muligt af jobannoncer på dansk og engelsk vedrørende job i Danmark (høj dækningsgrad)
— Løsningen skal indeholde værktøjer, der sikrer, at uønskede jobannoncer filtreres fra. Filtrene skal kunne vedligeholdes af STAR. Med uønsket menes jobannoncer, der indeholder uønskede ord, jobannoncer der ikke ønskes vist, herunder jobannoncer der kommer fra uønskede websites eller portaler
— Leverancerne skal i videst muligt omfang være renset for ikke-annoncer og dubletter, samt jobannoncer, der i forvejen ligger på henholdsvis Jobnet og WIDK. Med ikke-annoncer menes annoncer, det ikke indeholder et egentligt jobtilbud. Med dubletter menes jobannoncer der refererer til det samme job.
— I forhold til dubletter skal der desuden være et værktøj til hurtigt at kunne spotte og håndtere evt. dubletter, som søgemaskinen ikke opfattede som dubletter, men som alligevel på mange punkter er så ens, at der kunne være tale om dublet.
— Løsningen skal give mulighed for at ajourføre data om arbejdssted og stillingsbetegnelse på den enkelte annonce
Der skal desuden være mulighed for adgang til support, f.eks. i forbindelse med fejl i leverancerne.
Deadline
Fristen for modtagelse af bud var på 2016-01-26.
Indkøbet blev offentliggjort på 2015-12-17.
Leverandører
Følgende leverandører er nævnt i tildelingsbeslutninger eller andre indkøbsdokumenter:
Hvem?
Hvad?
Hvor?
Indkøbshistorik
Dato |
Dokument |
2015-12-17
|
Udbudsbekendtgørelse
|
2016-07-04
|
Bekendtgørelse om indgåede kontrakter
|