Diverse OpenAI - sjukt imponerende AI

morbid · 03.02.2025

En metode, og som vi har brukt med godt hell er Retrieval-Augmented Generation(RAG) sammen med språkmodellen da kan du kontekstualisere og bruke egne data som kilde til output.

Asbjørn · 03.02.2025

morbid skrev:
En metode, og som vi har brukt med godt hell er Retrieval-Augmented Generation(RAG) sammen med språkmodellen da kan du kontekstualisere og bruke egne data som kilde til output.

Ja, som sagt, prøvd her også, men ikke veldig imponert over resultatet.

Fra din link:

The use of RAG does not completely eliminate the general challenges faced by LLMs, including hallucination.

morbid · 03.02.2025

Niks, men reduserer det kraftig, f.eks så er det en stor fordel for språkmodellen å hente god dokumentasjon på det faktiske systemet brukeren vil vite noe om enn å ikke gjøre det.

Asbjørn · 03.02.2025

Jo, ser den, spesielt når det er firma-intern dokumentasjon som forhåpentligvis ikke hadde lekket ut for å bli brukt i generelle treningsdata. Da går man fra 100 % fabulering til kanskje 10 %, men kan fortsatt ikke vite hva som stemmer eller ikke i svarene uten å sjekke selv.

Hallucination (artificial intelligence) - Wikipedia

en.m.wikipedia.org

For example, a chatbot powered by large language models(LLMs), like ChatGPT, may embed plausible-sounding random falsehoods within its generated content. Researchers have recognized this issue, and by 2023, analysts estimated that chatbots hallucinate as much as 27% of the time,[8] with factual errors present in 46% of generated texts.[9] Detecting and mitigating these hallucinations pose significant challenges for practical deployment and reliability of LLMs in real-world scenarios.[10][8][9]

The hallucination phenomenon is still not completely understood. Researchers have also proposed that hallucinations are inevitable and are an innate limitation of large language models.[73] Therefore, there is still ongoing research to try to mitigate its occurrence.[74] Particularly, it was shown that language models not only hallucinate but also amplify hallucinations, even for those which were designed to alleviate this issue.[75]

Ji et al.[76] divide common mitigation method into two categories: data-related methods and modeling and inference methods. Data-related methods include building a faithful dataset, cleaning data automatically and information augmentation by augmenting the inputs with external information. Model and inference methods include changes in the architecture (either modifying the encoder, attention or the decoder in various ways), changes in the training process, such as using reinforcement learning, along with post-processing methods that can correct hallucinations in the output.

Researchers have proposed a variety of mitigation measures, including getting different chatbots to debate one another until they reach consensus on an answer.[77] Another approach proposes to actively validate the correctness corresponding to the low-confidence generation of the model using web search results. They have shown that a generated sentence is hallucinated more often when the model has already hallucinated in its previously generated sentences for the input, and they are instructing the model to create a validation question checking the correctness of the information about the selected concept using Bingsearch API.[78] An extra layer of logic-based rules was proposed for the web search mitigation method, by utilizing different ranks of web pages as a knowledge base, which differ in hierarchy.[79] When there are no external data sources available to validate LLM-generated responses (or the responses are already based on external data as in RAG), model uncertainty estimation techniques from machine learning may be applied to detect hallucinations.[80]

Link videre:

https://arxiv.org/pdf/2401.11817

Jeg ser det som et fundamentalt problem for LLM’er i alle noenlunde seriøse anvendelsesområder. Det er ikke bare en bug som vil bli fikset i neste release, men en grunnleggende egenskap ved hva LLM’er er og gjør.

PederP · 06.02.2025

What DeepSeek Means for Open-Source AI

Its new open reasoning model cuts costs drastically on AI reasoning

spectrum.ieee.org

PederP · 24.02.2025

BBC tester KI til nyhetsartikler – halvparten har store feil

Et nytt eksperiment fra BBC avslører alvorlige mangler i KI-genererte nyhetsartikler. I 51 prosent av de testede sakene fant de unøyaktigheter, feil sitater og misvisende fakta.

www.digi.no

Harry Stoteles · 24.02.2025

Ennå en stund til dette:

PederP · 03.03.2025

PederP · 06.03.2025

Are AI Breakthroughs the Key to Solving the World's Toughest Math Problems?

AI has mastered chess, but can it solve the world's toughest math problems? Researchers at Caltech have developed a new AI model that tackles complex math problems requiring thousands to millions of steps. Could this breakthrough help predict rare, disastrous events like hurricanes or financial...

spectrum.ieee.org

PederP · 08.03.2025

8. mars:– KI kan føre til et tilbakeslag for kvinnekampen

KI-systemer oppfattes gjerne som nøytrale. Men passer vi ikke på, kan algoritmene legge til rette for diskriminering av kvinner. Jurist vil ha lovendringer.

www.forskning.no

PederP · 08.03.2025

PederP · 11.03.2025

Nå kan vi endelig forstå hva dyr sier

Kunstig intelligens kan revolusjonere moderne dyrevelferd, mener forskergruppe bak ny, dansk studie.

www.forskning.no

PederP · 13.03.2025

Forskere advarer mot russisk desinformasjon i KI-modeller

Et omfattende russisk desinformasjonsnettverk manipulerer vestlige KI-samtaleroboter til å spre propaganda fra Kreml, advarer forskere.

www.digi.no

PederP · 19.03.2025

Europol advarer: Kriminelle utnytter KI og truer hele EU

Organisert kriminalitet utgjør nå ikke bare en trussel mot offentlig sikkerhet, den påvirker selve grunnlaget for EUs institusjoner og samfunn, advarer Europol.

www.digi.no

PederP · 20.03.2025

Are Google’s New Gemini Robotics Models the Key to Smarter, More Adaptable Robots?

Google DeepMind's new AI models, built on Google's Gemini foundation model, are making robots fold origami and slam dunk tiny basketballs. Gemini Robotics can interpret and act on text, voice, and image data, while Gemini Robotics-ER excels in "embodied reasoning." #AI #Robotics

spectrum.ieee.org

PederP · 20.03.2025

Nordmann klager ChatGPT til datatilsynet

Han krever et oppgjør med ChatGPT og får støtte til klagen.

www.nrk.no

Asbjørn · 20.03.2025

PederP skrev:
Nordmann klager ChatGPT til datatilsynet

Han krever et oppgjør med ChatGPT og får støtte til klagen.

www.nrk.no

ChatGPT dikta opp at norske Arve drepte sønnene sine – klages inn til Datatilsynet

– Det faktum at noen kan lese dette og tro det er sant, er det som skremmer meg mest, sier Arve Hjalmar Holmen, som nå får hjelp av Noyb til å klage inn OpenAI.

www.kode24.no

Dad demands OpenAI delete ChatGPT’s false claim that he murdered his kids

Blocking outputs isn’t enough; dad wants OpenAI to delete the false information.

arstechnica.com

Det er fint lite OpenAI kan gjøre for å «slette det ærekrenkende innholdet og justere modellen slik at den ikke genererer uriktige resultater». Den er en bullshitgenerator, og f..n vet hvilke assosiasjoner den koblet sammen for å gi en plausibelt utseende setning. Den har ikke noe forhold til om noe er sant eller ikke.

Det kan bli interessant juss om dette dekkes av GDPR eller ikke.

oen · 21.03.2025

ChatGPT ga NRK russisk propaganda og løy om det

Dette er skremmende, mener eksperter.

www.nrk.no

PederP · 21.03.2025

Asbjørn skrev:
ChatGPT dikta opp at norske Arve drepte sønnene sine – klages inn til Datatilsynet

– Det faktum at noen kan lese dette og tro det er sant, er det som skremmer meg mest, sier Arve Hjalmar Holmen, som nå får hjelp av Noyb til å klage inn OpenAI.

www.kode24.no

Dad demands OpenAI delete ChatGPT’s false claim that he murdered his kids

Blocking outputs isn’t enough; dad wants OpenAI to delete the false information.

arstechnica.com

Det er fint lite OpenAI kan gjøre for å «slette det ærekrenkende innholdet og justere modellen slik at den ikke genererer uriktige resultater». Den er en bullshitgenerator, og f..n vet hvilke assosiasjoner den koblet sammen for å gi en plausibelt utseende setning. Den har ikke noe forhold til om noe er sant eller ikke.

Det kan bli interessant juss om dette dekkes av GDPR eller ikke.

ChatGPT ga NRK russisk propaganda og løy om det

Dette er skremmende, mener eksperter.

www.nrk.no

defacto · 21.03.2025

Det begynner nå! Krigen om sannheten.

Asbjørn · 27.03.2025

Gödels teorem biter igjen. Det, termodynamikkens andre lov og lyshastigheten i vakuum utgjør alle tings iboende f..nskap. Ingen overraskelse at det også setter noen grenser her.

Mathematical paradox demonstrates the limits of AI

Humans are usually pretty good at recognising when they get things wrong, but artificial intelligence systems are not. According to a new study, AI generally

www.cam.ac.uk

https://www.pnas.org/doi/10.1073/pnas.2107151119

BurntIsland · 27.03.2025

Det viser seg at administrasjonen i Tromsø kommune har valgt å bruke ChatGPT til å skrive kunnskapsgrunnlaget for en viktig politisk sak, og nå er det avslørt at flesteparten av forskningsreferansene i grunnlaget rett og slett er hallusinert frem av chatboten. Dette hadde bare vært morsomt om det ikke var så tragisk.

Asbjørn · 27.03.2025

^ Var det der fhv kunnskapsministre fikk jobb etter sine plagiatsaker?

Harry Stoteles · 27.03.2025

Jeg mener oppriktig at dette er avskjedigelsesgrunnlag.

BurntIsland · 27.03.2025

Prosjektlederen har nok ikke tenkt å gå før vinden snur kraftig. Dette er bare en bagatell. Fra lokalavisa der oppe (iTromsø? kilde ikke oppgitt der jeg fant bildet)

BurntIsland · 27.03.2025

^Virker som en nokså arrogant type. 8 skoler risikerte nedlegging på "vitenskaplig" grunnlag. Oppdiktede undersøkelser og forskere som blir tillagt motstridende syn med de de egentlig står for. Har en mistanke om at fasiten ble skrevet først og "kunnskapsgrunnlaget" ble bestilt for å matche foretrukket konklusjon.
Det er tankevekkende, og nokså skremmende, at om chatboten ikke hadde knotet med referansene så ville ikke dette ha blitt avdekket.

Asbjørn · 27.03.2025

BurntIsland skrev:
Prosjektlederen har nok ikke tenkt å gå før vinden snur kraftig. Dette er bare en bagatell. Fra lokalavisa der oppe (iTromsø? kilde ikke oppgitt der jeg fant bildet)

Det er like nødvendig at han får sparken som at kunnskapsministre med tilfuskede mastergrader fikk fyken. Man kan virkelig ikke akseptere sånt. Dette er ikke en kommafeil i en bisetning, men helt bevisst forfalskning av et "kunnskapsgrunnlag" for en vesentlig beslutning. Det må få konsekvenser.

Asbjørn · 28.03.2025

The hilarious & horrifying hallucinations of AI - Sify

Artificial intelligence systems hallucinate just as humans do and when 'they' do, the rest of us might be in for a hard bargain, writes Satyen

www.sify.com

tjua · 28.03.2025

Asbjørn skrev:
Det er like nødvendig at han får sparken som at kunnskapsministre med tilfuskede mastergrader fikk fyken. Man kan virkelig ikke akseptere sånt. Dette er ikke en kommafeil i en bisetning, men helt bevisst forfalskning av et "kunnskapsgrunnlag" for en vesentlig beslutning. Det må få konsekvenser.

Implikasjonene av denne saken er enorm. I Tromsø leter man nå gjennom flere utredninger med sikte på å finne tilsvarende
Tillit er brutt
Tenk når dette sprer seg til all offentlig forvaltning
De unge som uteksamineres har et helt annet forhold til bruk av tekn9,og i, kilder og kildekritikk en det normalen var for bare kort tid siden. Når de jobber seg inn i/mot beslutningsnivå og takere i offentlig forvaltning blir det kjør
Og husk på: de unge er trent på innsalg av egen fortreffelighet og håndtering av kommunikasjon
Tilrivingsøkonomien blir nok den nye olja

Asbjørn · 28.03.2025

tjua skrev:
Og husk på: de unge er trent på innsalg av egen fortreffelighet og håndtering av kommunikasjon

Jeg rev verbalt hodet av en ung & lovende som forsøkte å selge oss noe AI-greier i går. Bullshit-filteret mitt gikk fullt og rant over. Tror ikke han hadde en god dag på jobb, dessverre.

Tweedjakke · 29.03.2025

tjua skrev:
I Tromsø leter man nå gjennom flere utredninger med sikte på å finne tilsvarende

Problemet er at det KI kastar i trynet på oss er måten vi sjølv bruker tekst.

Eit menneske vil ha sperrar mot å finna på forsking, men ikkje med å belegga ei utgreiing med eit obskurt funn som seinare er tilbakevist.

BurntIsland · 29.03.2025

Internett står på nesten hele døgnet, som forvaltningsminister Rigmor Aasrud sa en gang. Og Karianne Tung er ikke langt unna..

Tromsø Kommune brukte kunstig intelligens som hjelpemiddel i en rapport – det gikk ikke helt etter planen. | Karianne Tung

Tromsø Kommune brukte kunstig intelligens som hjelpemiddel i en rapport – det gikk ikke helt etter planen. Kommunen skal ha ros både for å ta i bruk teknologien, men også for å være åpne og reagere raskt når det viser seg at feil har blitt gjort. KI er et av de kraftigste verktøyene vi har...

no.linkedin.com

Ligner på en avskjedssøknad, spør du meg.

Tweedjakke · 29.03.2025

Har lyst til å sitera Jill Walker Retteberg frå kommentarfeltet:

Hva med klare retningslinjer for hva offentlig sektor faktisk IKKE bør gjøre med KI?

Her vart KI brukt på verst mogleg måte, for å laga ei (falsk) fagleg utgreiing for å støtta opp under eit politisk vedtak som truleg var upopulært, men kanskje naudsynt. Altså, for å produsera eit administrativt slagvåpen: ein rapport spekka med referansar til forsking.

«Offeret vart myrda med ein stump gjenstand. Alt vi veit er at han var forskingsbasert.»

PederP · 01.04.2025

PederP · 01.04.2025

Kommer KI til å gjøre utviklere late?

Det kan skje, om vi ikke er oppmerksomme på særlig en ting, mener Thomas Malt, avdelingsleder for kode og systemutvikling i Sopra Steria.

www.kode24.no

PederP · 01.04.2025

– AI bruker altfor mye strøm

Bare i Europa må det investeres over 11 billioner kroner.

www.tek.no

PederP · 02.04.2025

Harry Stoteles · 03.04.2025

Spørs vel hvem som er høne og hvem som er egg, men ChatGPT er tydeligvis like teit som trump.

Trump Accused of Using ChatGPT to Create Tariff Plan After AI Leads Users to Same Formula: 'So AI is Running the Country'

The Trump administration has been accused of using ChatGPT to calculate the tariffs it presented to the world on Wednesday.

www.latintimes.com

PeriodeLytter · 08.04.2025

Teit videotittel. Men Jordan demonstrerer først et virtuelt instrument han har vært å utvikke. 18 min ut i videoen kommer dem til AI som Jordan er med å lærer opp til å spille sammen med. Ikke ulikt prosjektet som Jojo Mayer turnerer med hvor han spiller trommer sammen med AI.

PederP · 10.04.2025

These 12 Eye-Opening Graphs Reveal the State of AI in 2025

Feeling overwhelmed by AI news? Stanford's 2025 AI Index cuts through the noise with a 400+ page report on AI's impact. Which we then boiled down to 12 key graphs. You're welcome. #AI

spectrum.ieee.org

Diverse OpenAI - sjukt imponerende AI

Hi-Fi freak

Rubinmedlem

Hi-Fi freak

Rubinmedlem

Hi-Fi freak

Hi-Fi freak

Hi-Fi freak

Hi-Fi freak

Hi-Fi freak

Hi-Fi freak

Hi-Fi freak

Hi-Fi freak

Hi-Fi freak

Hi-Fi freak

Hi-Fi freak

Hi-Fi freak

Rubinmedlem

Hi-Fi freak

Hi-Fi freak

Hi-Fi freak

Rubinmedlem

Hi-Fi freak

Rubinmedlem

Hi-Fi freak

Hi-Fi freak

Hi-Fi freak

Rubinmedlem

Rubinmedlem

Hi-Fi freak

Rubinmedlem

Hi-Fi freak

Hi-Fi freak

Hi-Fi freak

Hi-Fi freak

Hi-Fi freak

Hi-Fi freak

Hi-Fi freak

Hi-Fi freak

Hi-Fi freak

Hi-Fi freak