DeepSeek-R1 combina intelligenza artificiale ed edge computing per l'IoT industriale

Introduzione

I modelli distillati di piccole dimensioni di DeepSeek-R1 sono ottimizzati utilizzando i dati della catena di pensiero generati da DeepSeek-R1, contrassegnati con...tag, ereditando le capacità di ragionamento di R1. Questi set di dati ottimizzati includono esplicitamente processi di ragionamento come la decomposizione del problema e le deduzioni intermedie. L'apprendimento per rinforzo ha allineato i modelli di comportamento del modello distillato con i passaggi di ragionamento generati da R1. Questo meccanismo di distillazione consente ai modelli di piccole dimensioni di mantenere l'efficienza computazionale ottenendo al contempo capacità di ragionamento complesse vicine a quelle dei modelli più grandi, il che ha un valore applicativo significativo in scenari con risorse limitate. Ad esempio, la versione 14B raggiunge il 92% del completamento del codice del modello DeepSeek-R1 originale. Questo articolo introduce il modello distillato DeepSeek-R1 e le sue principali applicazioni nell'edge computing industriale, riassunte nelle seguenti quattro direzioni, insieme a casi di implementazione specifici:

dc3c637c5bead8b62ed51b6d83ac0b4

Manutenzione predittiva delle apparecchiature

Implementazione tecnica

Fusione dei sensori:

Integrare dati di vibrazione, temperatura e corrente dai PLC tramite il protocollo Modbus (frequenza di campionamento 1 kHz).

Estrazione delle caratteristiche:

Esegui Edge Impulse su Jetson Orin NX per estrarre le caratteristiche delle serie temporali a 128 dimensioni.

Inferenza del modello:

Distribuire il modello DeepSeek-R1-Distill-14B, inserendo vettori di caratteristiche per generare valori di probabilità di errore.

Regolazione dinamica:

Attivare gli ordini di lavoro di manutenzione quando la fiducia è > 85% e avviare un processo di verifica secondaria quando è < 60%.

Caso rilevante

Schneider Electric ha implementato questa soluzione sui macchinari per l'industria mineraria, riducendo il tasso di falsi positivi del 63% e i costi di manutenzione del 41%.

1

Esecuzione del modello distillato DeepSeek R1 su computer edge InHand AI

Ispezione visiva avanzata

Architettura di output

Tipica pipeline di distribuzione:

telecamera = GigE_Vision_Camera(500fps) # Telecamera industriale Gigabit
frame = camera.capture() # Cattura l'immagine
preprocessed = OpenCV.denoise(frame) # Preelaborazione con rimozione del rumore
defect_type = DeepSeek_R1_7B.infer(preelaborato) # Classificazione dei difetti
se defect_type != 'normale':
PLC.trigger_reject() # Attiva il meccanismo di ordinamento

Misure di prestazione

Ritardo di elaborazione:

82 ms (Jetson AGX Orin)

Precisione:

La rilevazione dei difetti nello stampaggio a iniezione raggiunge il 98,7%.

2

Implicazioni di DeepSeek R1: vincitori e vinti nella catena del valore dell'intelligenza artificiale generativa

Ottimizzazione del flusso di processo

Tecnologie chiave

Interazione del linguaggio naturale:

Gli operatori descrivono a voce le anomalie delle apparecchiature (ad esempio, "Fluttuazione della pressione dell'estrusore ±0,3 MPa").

Ragionamento multimodale:

Il modello genera suggerimenti di ottimizzazione basati sui dati storici dell'attrezzatura (ad esempio, regolazione della velocità della vite del 2,5%).

Verifica del gemello digitale:

Validazione della simulazione dei parametri sulla piattaforma EdgeX Foundry.

Effetto di implementazione

L'impianto chimico della BASF ha adottato questo schema, ottenendo una riduzione del 17% nel consumo energetico e un aumento del 9% nel tasso di qualità del prodotto.

3

Edge AI e il futuro del business: OpenAI o1 vs. DeepSeek R1 per sanità, automotive e IIoT

Recupero immediato della Knowledge Base

Progettazione architettonica

Database vettoriale locale:

Utilizzare ChromaDB per archiviare i manuali delle apparecchiature e le specifiche dei processi (incorporando la dimensione 768).

Recupero ibrido:

Combina l'algoritmo BM25 + la similarità del coseno per la query.

Generazione dei risultati:

Il modello R1-7B riassume e perfeziona i risultati del recupero.

Caso tipico

Gli ingegneri Siemens hanno risolto i guasti degli inverter tramite query in linguaggio naturale, riducendo il tempo medio di elaborazione del 58%.

Sfide e soluzioni di distribuzione

Limitazioni di memoria:

È stata utilizzata la tecnologia di quantizzazione KV Cache, riducendo l'utilizzo di memoria del modello 14B da 32 GB a 9 GB.

Garantire prestazioni in tempo reale:

Latenza di inferenza singola stabilizzata a ±15 ms tramite ottimizzazione del grafico CUDA.

Deriva del modello:

Aggiornamenti incrementali settimanali (trasmissione solo del 2% dei parametri).

Ambienti estremi:

Progettato per un ampio intervallo di temperatura da -40°C a 85°C con livello di protezione IP67.

5
微信图片_20240614024031.jpg1

Conclusione

Gli attuali costi di implementazione sono ora scesi a 599 dollari/nodo (Jetson Orin NX), con applicazioni scalabili in settori come la produzione 3C, l'assemblaggio automobilistico e la chimica energetica. Si prevede che la continua ottimizzazione dell'architettura MoE e della tecnologia di quantizzazione consentirà l'esecuzione del modello 70B su dispositivi edge entro la fine del 2025.

Trova la soluzione per cavi ELV

Cavi di controllo

Per cavi BMS, BUS, industriali e di strumentazione.

Sistema di cablaggio strutturato

Rete e dati, cavo in fibra ottica, cavo di collegamento, moduli, mascherina

Rassegna Mostre ed Eventi 2024

16-18 aprile 2024 Middle-East-Energy a Dubai

16-18 aprile 2024 Securika a Mosca

9 maggio 2024 Evento di lancio di nuovi prodotti e tecnologie a Shanghai

22-25 ottobre 2024 SICUREZZA CINA a Pechino

19-20 novembre 2024 MONDO CONNESSO KSA


Data di pubblicazione: 07-02-2025