Commit fa236fd7 authored by jg5dev's avatar jg5dev 💬
Browse files

better

parent 9db11bb1
Loading
Loading
Loading
Loading
+1 −1
Original line number Diff line number Diff line
@@ -228,5 +228,5 @@ Per a volums superiors, un vector store justifica la complexitat addicional.

Aquests conceptes apareixen aplicats en altres parts dels materials:

- [Patrons de programació amb LLMs](../llms/llm_systems.md) — cobreix la selecció pràctica de models d'embeddings, estratègies de chunking, cerca híbrida i l'ús de Chroma en pipelines RAG.
- [Prompts i integració](../llms/llm_systems.md) — cobreix la selecció pràctica de models d'embeddings, estratègies de chunking, cerca híbrida i l'ús de Chroma en pipelines RAG.
- [Sistemes de recomanació](./ml_recommender.md) — l'arquitectura two-tower usa embeddings apresos per a usuaris i ítems; la fase de *retrieval* s'implementa amb ANN sobre els vectors d'ítems precomputats.
+1 −1
Original line number Diff line number Diff line
@@ -2,7 +2,7 @@

<!-- toc -->

Aquest document descriu com encaixar un LLM en una arquitectura de programari: quines propietats té com a component, com se serveix (Ollama, vLLM), quin estàndard d'API s'usa i quins requisits de maquinari imposen els pesos i la KV cache. Per als patrons de programació (prompts, RAG, eines), consulta [Patrons de programació amb LLMs](llm_systems.md).
Aquest document descriu com encaixar un LLM en una arquitectura de programari: quines propietats té com a component, com se serveix (Ollama, vLLM), quin estàndard d'API s'usa i quins requisits de maquinari imposen els pesos i la KV cache. Per als patrons de programació (prompts, RAG, eines), consulta [Prompts i integració](llm_systems.md).

## Arquitectura d'un sistema LLM

+1 −1
Original line number Diff line number Diff line
@@ -173,4 +173,4 @@ La columna "primera opció" reflecteix models que cobreixen les capacitats crít

**Models de referència actuals (2026):** a tall d'il·lustració — Claude Sonnet 4.6 i GPT-5 com a models mitjos de referència; Claude Opus 4.7 i GPT-5 (amb raonament estès) com a models grans; Llama 4 i Mistral Large com a opcions locals. La matriu de verificació de la secció anterior és l'eina per avaluar nous models quan apareguin.

> 📝 Per als patrons de prompting, sortida estructurada i tool use, consulta [Patrons de programació amb LLMs](llm_systems.md). Per als requisits de maquinari dels models locals i les opcions de desplegament, consulta [Arquitectura de sistemes LLM](llm_architecture.md).
> 📝 Per als patrons de prompting, sortida estructurada i tool use, consulta [Prompts i integració](llm_systems.md). Per als requisits de maquinari dels models locals i les opcions de desplegament, consulta [Arquitectura de sistemes LLM](llm_architecture.md).
+1 −1
Original line number Diff line number Diff line
@@ -2,7 +2,7 @@

<!-- toc -->

Aquest document cobreix tres dimensions que converteixen un sistema LLM funcional en un sistema desplegable: com observar-lo quan funciona en producció (observabilitat), com empaquetar-lo perquè qualsevol el pugui executar (integració i desplegament), i com gestionar la seva evolució al llarg del temps (cicle de vida del sistema). Per a la metodologia d'avaluació (evals, graders, pass@k), consulta [Avaluació de sistemes LLM](llm_evals.md). Per als patrons de programació (prompts, RAG, eines), consulta [Patrons de programació amb LLMs](llm_systems.md).
Aquest document cobreix tres dimensions que converteixen un sistema LLM funcional en un sistema desplegable: com observar-lo quan funciona en producció (observabilitat), com empaquetar-lo perquè qualsevol el pugui executar (integració i desplegament), i com gestionar la seva evolució al llarg del temps (cicle de vida del sistema). Per a la metodologia d'avaluació (evals, graders, pass@k), consulta [Avaluació de sistemes LLM](llm_evals.md). Per als patrons de programació (prompts, RAG, eines), consulta [Prompts i integració](llm_systems.md).

Una intuïció que ordena tot el que segueix: és temptador pensar que un sistema LLM *és* el model. No ho és. La crida a l'API és la part trivial; la complexitat real resideix en tot el que l'envolta — validació, observabilitat, cicle de vida, desplegament. El model canvia de versió o de proveïdor; la infraestructura que l'envolta és el que realment construeixes i mantens.

+1 −1
Original line number Diff line number Diff line
@@ -193,7 +193,7 @@ def classificar_amb_routing(text: str) -> str:
                      → confiança baixa → [LLM]
```

La implementació del routing es cobreix a [Patrons de programació amb LLMs](llm_systems.md).
La implementació del routing es cobreix a [Prompts i integració](llm_systems.md).

### LLM com a extractor de features

Loading