Valentin Lapchevskiy
Valentin Lapchevskiy
AI-Native Product Engineer — full-stack + LLM / agent systems, end-to-end

I ship full products end-to-end — backend, frontend, and the LLM-agent layer — by orchestrating AI coding agents at team-level throughput.

Summary

AI-native product engineer who ships full systems end-to-end — backend, frontend, and the LLM-agent layer — by orchestrating AI coding agents at team-level throughput. 15 years building products: co-founder of App in the Air (7M users, Apple App of the Year) and a Top-Rated freelancer with $300K+ across 61 projects (~100% success). Recent focus: production agentic systems, multimodal LLM pipelines, and AI interpretability.

Selected Work

B2B Brand-Creator Marketing Platform
  • Architecting a Temporal-based workflow engine and an AI provider control plane (cost ledger, rate limiting, circuit breakers, webhook replay) powering a multi-domain platform.
  • Established a domain-driven monorepo (portable platform core + business domains) with P0–P5 smoke gates and full observability (Grafana / Loki / Alloy).
  • Building a skills-based LLM generation system (18+ domain skills — brand enrichment, brief/script generation, anti-fraud) with guardrails and quality evals.
Agentic Support System
  • Built an end-to-end LLM-agent support system (Vercel AI SDK, OODA tool-calling loop) across Telegram / Email / Web — intent classification, field extraction, automated ticketing; delivered in < 2 months (3 prototypes → production).
  • Engineered multimodal intake (vision + Whisper STT) and context-aware memory over PostgreSQL/pgvector + Redis.
  • Implemented a self-improving eval loop (45+ real cases → LLM-driven prompt refinement → regression gating in CI) and production infra (Docker, Langfuse, retry queues, graceful shutdown).
Auditable Corporate-Memory System
  • Designed and prototyped an auditable corporate-memory system — immutable raw layer + re-creatable structured layer, giving end-to-end provenance from any AI output back to its source.
  • Built LLM knowledge-graph extraction (entities / relations / facts) with pluggable per-domain lenses and type guards over PostgreSQL/pgvector, served via MCP — handed off as a prototype for further development.
Viracle — AI Video-Virality Analytics
  • Architected an event-driven backend (Fastify, Temporal.io, 4 microservices) that scrapes, analyzes, and scores short-form video (TikTok / Reels / Shorts).
  • Built multimodal video analysis on Gemini structured outputs (hook, pacing, CTA, niche, sentiment) and a 7-stage Python ML pipeline (correlation, clustering, anomaly detection → content directives).
  • Built production-grade infra: PostgreSQL/Drizzle (20+ tables), Redis Streams, full observability (Prometheus / Grafana / Jaeger), billing & auth.
Noracle — AI Dream-Interpretation SaaS
  • Shipped a live, monetized Telegram AI product — dream interpretation plus an evolving per-user personality profile (Telegram Stars billing; 38% D30 retention among paying users).
  • Built a multi-stage LLM pipeline — agentic mode routing, multi-provider image generation, per-tier cost guards, structured outputs (~$0.02/dream).
  • Executed a zero-downtime, idempotent migration of 3,485 users / 6,340 records with cold-backup safety.
Independent AI Research — Interpretability & Efficient Architectures
  • 200+ experiments on extracting exact, verifiable logic from trained networks (lossless NN → formula → Verilog), vs. approximate methods (SHAP/LIME).
  • Notable results: parity-128 in 40 parameters; a GPT-2 reasoning-coprocessor adapter lifting 8-bit arithmetic from 0%→97% at 0.08% of parameters; 131× FHE inference speedup.
  • Rigorous methodology (multi-seed, Bonferroni correction, 3 verification rounds) with a documented falsified-hypotheses log.
GRAB-A-WORD-II — Real-time Multiplayer Word Game
  • Built a solo full-stack real-time multiplayer game (Nuxt/Vue, Socket.io, Redis/BullMQ) with RU/EN localization and Telegram integration.
  • Created a modular design system (Storybook, 26 components) and an Apify + OpenAI dictionary pipeline across a 10-module monorepo.

Experience

Independent Full-Stack Engineer & Product Consultant
  • $300K+ earned across 61 projects / 4,446 hours, ~100% success; clients primarily in the US, Canada, and Europe.
  • 30+ MVPs and proofs-of-concept; deep involvement in product decisions and technical advising.
Co-founder · Product & Full-Stack Engineer
  • Co-founded a travel-assistant app: 7M users, Apple App of the Year, Editors' Choice, preinstalled across Apple Stores worldwide.
Creative Technologist · Visual Programmer
  • Interactive installations and real-time visual systems (TouchDesigner, Ventuz, GLSL, Arduino).
Valentin Lapchevskiy · AI-Native Product Engineer · Open to select contract & fractional engagements — remote.
Valentin Lapchevskiy
Valentin Lapchevskiy
AI-Native Product Engineer — full-stack + LLM / агентные системы, end-to-end

Собираю продукты целиком — backend, frontend и LLM-слой — оркестрируя кодинг-агентов с производительностью команды.

Кратко

AI-native продуктовый инженер: собираю системы целиком — backend, frontend и LLM/агентный слой — оркестрируя кодинг-агентов с производительностью команды. 15 лет строю продукты: co-founder App in the Air (7M пользователей, Apple App of the Year) и Top-Rated фрилансер с $300K+ за 61 проект (~100% success). Текущий фокус: production-системы на LLM-агентах, мультимодальные LLM-пайплайны, интерпретируемость ИИ.

Избранные проекты

B2B-платформа для коллабораций брендов и креаторов
  • Проектирую workflow-движок на Temporal и control plane для AI-провайдеров (cost ledger, rate-limiting, circuit breakers, webhook-replay) для мультидоменной платформы.
  • Выстроил domain-driven монорепо (переносимое platform-ядро + бизнес-домены) с P0–P5 smoke-гейтами и полным observability (Grafana / Loki / Alloy).
  • Строю skills-based LLM-генерацию (18+ доменных skill'ов — обогащение бренда, генерация брифов/сценариев, антифрод) с guardrails и quality-eval.
Agentic-система поддержки
  • Построил end-to-end систему поддержки на LLM-агентах (Vercel AI SDK, OODA tool-calling loop) для Telegram / Email / Web — классификация intent, извлечение полей, авто-тикетинг; собрано за < 2 месяцев (3 прототипа → production).
  • Реализовал мультимодальный ввод (vision + Whisper STT) и контекстную память поверх PostgreSQL/pgvector + Redis.
  • Внедрил самоулучшающийся eval-loop (45+ реальных кейсов → LLM-правка промптов → regression-гейтинг в CI) и production-инфру (Docker, Langfuse, retry-очереди, graceful shutdown).
Аудируемая система корпоративной памяти
  • Спроектировал и прототипировал аудируемую систему корпоративной памяти — неизменяемый raw-слой + пересоздаваемый structured-слой, дающие сквозной provenance от любого AI-вывода к первоисточнику.
  • Построил LLM-извлечение knowledge-graph (сущности / связи / факты) с подключаемыми доменными «призмами» и type-guard'ами поверх PostgreSQL/pgvector, отдача через MCP — передан как прототип для дальнейшей доработки.
Viracle — AI-аналитика виральности видео
  • Спроектировал event-driven backend (Fastify, Temporal.io, 4 микросервиса), который скрейпит, анализирует и оценивает короткие видео (TikTok / Reels / Shorts).
  • Построил мультимодальный анализ видео на Gemini structured outputs (хук, пейсинг, CTA, ниша, sentiment) и 7-уровневый Python ML-пайплайн (корреляции, кластеризация, детекция аномалий → контент-рекомендации).
  • Построил production-grade инфру: PostgreSQL/Drizzle (20+ таблиц), Redis Streams, полный observability (Prometheus / Grafana / Jaeger), биллинг и auth.
Noracle — AI-SaaS интерпретации снов
  • Запустил живой монетизированный Telegram-AI-продукт — интерпретация снов + развивающийся психо-портрет пользователя (оплата Telegram Stars; D30-retention 38% среди платящих).
  • Собрал многоэтапный LLM-пайплайн — агентный роутинг режимов, мультипровайдерная генерация картинок, per-tier cost-guards, structured outputs (~$0.02/сон).
  • Выполнил zero-downtime идемпотентную миграцию 3 485 пользователей / 6 340 записей с cold-backup.
Независимое AI-исследование — интерпретируемость и эффективные архитектуры
  • 200+ экспериментов по извлечению точной, верифицируемой логики из обученных сетей (lossless NN → формула → Verilog), в отличие от приближённых методов (SHAP/LIME).
  • Результаты: parity-128 на 40 параметрах; адаптер-копроцессор для GPT-2, поднимающий 8-битную арифметику с 0%→97% при 0.08% параметров; ускорение инференса FHE 131×.
  • Строгая методология (multi-seed, поправка Бонферрони, 3 раунда верификации) с задокументированным логом опровергнутых гипотез.
GRAB-A-WORD-II — real-time мультиплеер, словесная игра
  • Построил соло full-stack real-time мультиплеер (Nuxt/Vue, Socket.io, Redis/BullMQ) с локализацией RU/EN и Telegram-интеграцией.
  • Создал модульную дизайн-систему (Storybook, 26 компонентов) и словарный пайплайн (Apify + OpenAI) в монорепо из 10 модулей.

Опыт

Независимый full-stack инженер и продуктовый консультант
  • $300K+ заработано за 61 проект / 4 446 часов, ~100% success; клиенты преимущественно US, Canada, Europe.
  • 30+ MVP и proof-of-concept; глубокое участие в продуктовых решениях и техническом консультировании.
Co-founder · продукт и full-stack инженер
  • Со-основал travel-ассистент: 7M пользователей, Apple App of the Year, Editors' Choice, предустановка во всех Apple Store мира.
Creative Technologist · Visual Programmer
  • Интерактивные инсталляции и real-time визуальные системы (TouchDesigner, Ventuz, GLSL, Arduino).
Valentin Lapchevskiy · AI-Native Product Engineer · Открыт к контрактным и fractional-проектам — remote.
Valentin Lapchevskiy
Valentin Lapchevskiy
AI-Native Product Engineer — full-stack + sistemas LLM / agentes, de extremo a extremo

Entrego productos completos de extremo a extremo — backend, frontend y la capa de agentes LLM — orquestando agentes de programación con el rendimiento de un equipo.

Resumen

Ingeniero de producto AI-native que entrega sistemas completos de extremo a extremo — backend, frontend y la capa de agentes LLM — orquestando agentes de programación con el rendimiento de un equipo. 15 años construyendo productos: cofundador de App in the Air (7M usuarios, Apple App of the Year) y freelancer Top-Rated con $300K+ en 61 proyectos (~100% de éxito). Enfoque reciente: sistemas con agentes en producción, pipelines LLM multimodales e interpretabilidad de IA.

Proyectos destacados

Plataforma B2B de colaboración marca-creador
  • Diseñando un motor de workflows basado en Temporal y un control plane de proveedores de IA (cost ledger, rate limiting, circuit breakers, reintento de webhooks) que impulsa una plataforma multidominio.
  • Establecí un monorepo orientado a dominios (núcleo de plataforma portable + dominios de negocio) con smoke gates P0–P5 y observabilidad completa (Grafana / Loki / Alloy).
  • Construyendo un sistema de generación con LLM basado en skills (18+ skills de dominio — enriquecimiento de marca, generación de briefs/guiones, antifraude) con guardrails y evaluaciones de calidad.
Sistema de soporte con agentes LLM
  • Construí un sistema de soporte de extremo a extremo con agentes LLM (Vercel AI SDK, bucle OODA con tool-calling) en Telegram / Email / Web — clasificación de intención, extracción de campos y ticketing automatizado; entregado en < 2 meses (3 prototipos → producción).
  • Desarrollé entrada multimodal (visión + Whisper STT) y memoria contextual sobre PostgreSQL/pgvector + Redis.
  • Implementé un bucle de evaluación auto-mejorable (45+ casos reales → refinamiento de prompts con LLM → gating de regresión en CI) e infraestructura de producción (Docker, Langfuse, colas de reintento, apagado controlado).
Sistema de memoria corporativa auditable
  • Diseñé y prototipé un sistema de memoria corporativa auditable — capa raw inmutable + capa estructurada recreable, con procedencia de extremo a extremo desde cualquier salida de IA hasta su fuente.
  • Construí extracción de knowledge-graph con LLM (entidades / relaciones / hechos) con lentes por dominio configurables y type guards sobre PostgreSQL/pgvector, expuesto vía MCP — entregado como prototipo para desarrollo posterior.
Viracle — Analítica de viralidad de vídeo con IA
  • Diseñé un backend orientado a eventos (Fastify, Temporal.io, 4 microservicios) que rastrea, analiza y puntúa vídeo corto (TikTok / Reels / Shorts).
  • Construí análisis multimodal de vídeo sobre structured outputs de Gemini (hook, ritmo, CTA, nicho, sentimiento) y un pipeline de ML en Python de 7 etapas (correlación, clustering, detección de anomalías → directrices de contenido).
  • Construí infraestructura de nivel producción: PostgreSQL/Drizzle (20+ tablas), Redis Streams, observabilidad completa (Prometheus / Grafana / Jaeger), facturación y autenticación.
Noracle — SaaS de interpretación de sueños con IA
  • Lancé un producto de IA en vivo y monetizado en Telegram — interpretación de sueños + un perfil de personalidad por usuario que evoluciona (facturación con Telegram Stars; 38% de retención D30 entre usuarios de pago).
  • Construí un pipeline LLM multi-etapa — enrutado agéntico de modos, generación de imágenes multi-proveedor, guardas de coste por tier, structured outputs (~$0.02/sueño).
  • Ejecuté una migración idempotente sin downtime de 3.485 usuarios / 6.340 registros con respaldo en frío.
Investigación independiente en IA — interpretabilidad y arquitecturas eficientes
  • 200+ experimentos sobre extracción de lógica exacta y verificable de redes entrenadas (NN → fórmula → Verilog sin pérdida), frente a métodos aproximados (SHAP/LIME).
  • Resultados destacados: parity-128 con 40 parámetros; un adaptador-coprocesador para GPT-2 que eleva la aritmética de 8 bits de 0%→97% con el 0,08% de los parámetros; aceleración de inferencia 131× bajo FHE.
  • Metodología rigurosa (multi-seed, corrección de Bonferroni, 3 rondas de verificación) con un registro documentado de hipótesis refutadas.
GRAB-A-WORD-II — Juego de palabras multijugador en tiempo real
  • Construí en solitario un juego multijugador full-stack en tiempo real (Nuxt/Vue, Socket.io, Redis/BullMQ) con localización RU/EN e integración con Telegram.
  • Creé un sistema de diseño modular (Storybook, 26 componentes) y un pipeline de diccionarios (Apify + OpenAI) en un monorepo de 10 módulos.

Experiencia

Ingeniero full-stack independiente y consultor de producto
  • $300K+ generados en 61 proyectos / 4.446 horas, ~100% de éxito; clientes principalmente en EE. UU., Canadá y Europa.
  • 30+ MVPs y pruebas de concepto; participación profunda en decisiones de producto y asesoría técnica.
Cofundador · Ingeniero de producto y full-stack
  • Cofundé una app de asistente de viajes: 7M usuarios, Apple App of the Year, Editors' Choice, preinstalada en las Apple Store de todo el mundo.
Creative Technologist · Visual Programmer
  • Instalaciones interactivas y sistemas visuales en tiempo real (TouchDesigner, Ventuz, GLSL, Arduino).