AI LLM MOC
LLM = Large Language Models
Bygg chat bot for egen data
Chat med dokumentasjonen din
Chat med dokumentasjonen din - Nøkkelkonsepter
Chat med dokumentasjonen din - Implementasjon
Liste over GPTer
Microsoft build 23.05.2023
Begreper
Lyver med selvtillit
Vi må injecte context for å klare å spørre om det vi vil spørre om.
Hvordan klarer vi å velge riktig context? Vi bruker embeddings.
- Et vector space, altså samling av vektorer, hvor de vektorene som er like er nære hverandre.
- Må vektorize input. Databaser har masse å velge mellom.
- Om man skal. embedde text kan det være naturlig å splitte på header.
- OpenAI har også APIer for å generere vektorer. Da kan man lagre dem i en hvilken som helst database som har vektor støtte.
- Hvordan skal man formatere promptet for å få best mulig svar?
- prmpts.AI - codesandbox for prompt engineering
- Gi en identitet. "You are a very enthusiastic developer who loves to help people!"
- Task - "Given the following sections from the docs, answer the question using only that information, outputted in markdown format"
- Condition - "If you are unsure and the answer is not explicitly written in the documentation, sa "Sorry, I Dont know how to help with that".
- Context sections (context injection) - Tekst som er hentet fra vector databasen
- Question: """
- {{sanitizedQuery}}
- """
- OpenAI anbefaler å trykke det inn i """ for å vise ekstra godt hva spørsmålet er.
- Ekstra hint: "Answer as markdown (include related code snippets if available)"
Liste med tall
Database hvor man kan lagre og gjøre spørre med vektorer
Eksempel databaser
- Pinecone
- PgVector i Postgres
- Weaviate
Dev Verktøy
-
GitHub Copilot
-
Amazon CodeWhisperer
-
Langchain - Rammeverk for å bygge apper som bruker LLMs. Gjør det enklere å integrere mot andre datakilder
-
Cursor - Editor med AI som "hoved" input
-
AutoGPT - Script som tar imot en oppgave som start, og kjører GPT rekursivt for å oppnå målet.
-
ChatGPT Retrieval Plugin - Plugin som lar deg enkelt søke i personlige dokumenter.
-
Semantic Kernel - Rammeverk/SDK for å lage Plugins for LLMs som lar dem enkelt kalle funksjoner med input og bruke outputen.
Pitfalls
The AI Dilemma - Center for Humane Technology
50% av forskere gir > 10% sjanse for at AI utsletter menneskeheten.
Emergent properties
Egenskaper modellen får etter at den når en viss størrelse, som den ikke hadde når den var mindre.
Eks: En modell trent på engelsk data kan plutselig snakke persisk.
Emergent Abilities of Large Language Models artikkel
Problemet med dette er at vi ikke vet hvilke egenskaper en modell faktisk har. De kan ligge skjult, uten at noen vet at de er der.
Relatert:
Sjakk har aldri vært mer populært, til tross for at maskiner er bedre enn mennesker
Emergence
Emergence Tower