Pixi Tasks Reference

Complete reference for all available Pixi tasks in Vision Text Extractor. These tasks provide convenient shortcuts for common operations.

🚀 Quick Task Overview

# List all available tasks
pixi task list

# Get help for any task
pixi run <task-name> --help

📋 Task Categories

🔧 Setup & Installation

setup - Complete system validation
setup-ollama - Install Ollama and LLaVA
setup-smolvlm - Download SmolVLM model
setup-env - Create environment file
install-deps - Install dependencies

🤖 OCR Processing

ocr_llm - General purpose OCR (flexible)
ocr_ollama - Ollama LLaVA OCR (flexible)
ocr_smolvlm - SmolVLM OCR (flexible)
ocr_url_example - Test with online image

🎯 Demo Commands

demo-ocr-huggingface - SmolVLM demo
demo-ocr-ollama - Ollama demo
demo-ocr-openai - OpenAI demo

✅ Testing & Validation

test-setup - Validate dependencies
test-components - Test functionality
test-imports - Check imports
check-env - Verify environment variables

🔄 Utility Tasks

clean - Clean cache and temporary files

📖 Detailed Task Reference

Setup & Installation Tasks

`setup`

Purpose: Complete system validation and setup

pixi run setup

✅ Validates all dependencies
✅ Tests all AI providers
✅ Checks environment configuration
✅ Provides setup recommendations

Dependencies: None
Time: 30-60 seconds

`setup-ollama`

Purpose: Install Ollama and download LLaVA model

pixi run setup-ollama

📥 Downloads and installs Ollama
📥 Pulls LLaVA 7B model (~4GB)
✅ Configures Ollama service
✅ Tests model functionality

Dependencies: Internet connection
Time: 5-15 minutes (depending on internet speed)
Disk Space: ~4GB

`setup-smolvlm`

Purpose: Download Hugging Face SmolVLM model

pixi run setup-smolvlm

📥 Downloads SmolVLM-Instruct model (~2GB)
✅ Configures Hugging Face cache
✅ Tests model loading
✅ Validates CUDA availability (if applicable)

Dependencies: Internet connection
Time: 3-10 minutes
Disk Space: ~2GB

`setup-env`

Purpose: Create environment configuration file

pixi run setup-env

📄 Copies .env.example to .env
⚠️ Won't overwrite existing .env
📝 You must manually edit API keys

Dependencies: None
Time: < 1 second

`install-deps`

Purpose: Install or refresh all dependencies

pixi run install-deps

📦 Equivalent to pixi install
🔄 Useful for refreshing dependencies
✅ Validates environment

Dependencies: Internet connection
Time: 1-5 minutes

OCR Processing Tasks

`ocr_llm`

Purpose: Flexible OCR using SmolVLM (requires image argument)

pixi run ocr_llm "path/to/image.jpg"
pixi run ocr_llm "https://example.com/image.png"

🤖 Uses Hugging Face SmolVLM by default
📁 Accepts local files or URLs
⚙️ Requires prior setup-smolvlm

Arguments: Image path (required)
Dependencies: setup-smolvlm

`ocr_ollama`

Purpose: Flexible OCR using Ollama LLaVA (requires image argument)

pixi run ocr_ollama "path/to/image.jpg"

🤖 Uses Ollama LLaVA model
📁 Accepts local files or URLs
⚙️ Add --provider ollama --model llava:7b for explicit control

Arguments: Image path (required)
Dependencies: Manual Ollama setup or setup-ollama

`ocr_smolvlm`

Purpose: Explicit SmolVLM OCR (requires image argument)

pixi run ocr_smolvlm "path/to/image.jpg"

🤖 Explicitly uses SmolVLM provider
📁 Accepts local files or URLs
⚙️ Identical to ocr_llm but more explicit

Arguments: Image path (required)
Dependencies: setup-smolvlm

`ocr_url_example`

Purpose: Test OCR with a fixed online image

pixi run ocr_url_example

🌐 Uses fixed recipe image URL
✅ Good for testing URL functionality
🔍 No arguments needed

Arguments: None
Dependencies: setup-smolvlm, Internet connection

Demo Commands

`demo-ocr-huggingface`

Purpose: Quick SmolVLM demo with sample image

pixi run demo-ocr-huggingface

🖼️ Uses images/chocolate_cake_recipe.png
🤖 Hugging Face SmolVLM provider
✅ Perfect for testing after installation

Arguments: None
Dependencies: setup-smolvlm

`demo-ocr-ollama`

Purpose: Quick Ollama demo with sample image

pixi run demo-ocr-ollama

🖼️ Uses images/chocolate_cake_recipe.png
🤖 Ollama LLaVA 7B model
✅ Good for comparing with SmolVLM

Arguments: None
Dependencies: setup-ollama

`demo-ocr-openai`

Purpose: Quick OpenAI demo with sample image

pixi run demo-ocr-openai

🖼️ Uses images/chocolate_cake_recipe.png
🤖 OpenAI GPT-4o model
🔑 Requires valid API key in .env

Arguments: None
Dependencies: OpenAI API key in .env

Testing & Validation Tasks