Agent Skills·Tag ·metrics

Tag · 1,355 skills

Agent skills tagged metrics

1,355 SKILL.md skills tagged metrics — the most complete ones are below, all usable across Hermes, Cursor, Codex, Gemini CLI, OpenCode, Claude Code and 30+ more agents.

Browse all 1,355 metrics skills →

Use this skill whenever the user needs VMware Aria Operations data — performance metrics, alerts, capacity planning, anomaly detection, and automated reports...

openclawvmwaremonitoringmetrics

Use this skill when the user says "builder stats", "stats check", "AI-native check-in", "scan my machine", "run my stats", "how AI-native am I", or when a user pastes an install-an…

claude-codestatsai-nativescan

garmin-health-analysis

Talk to your Garmin data naturally - "what was my fastest speed snowboarding?", "how did I sleep last night?", "what was my heart rate at 3pm?". Access 20+ metrics (sleep stages, B…

claude-codecodexcursorgemini-cligarminhealthwearables

empirical-prompt-tuning

Fetch and execute mizchi's empirical-prompt-tuning skill at runtime. Use when evaluating or iteratively refining an agent-facing prompt (skill / slash command / task prompt / CLAUD…

claude-codecodexcursorgemini-cliprompt-tuningevaluationmetrics

Augments a Wren project with business context missing from schema: enum meanings, units, NULL semantics, sentinels, soft-delete rules, synonyms, time conventions, cross-system IDs,…

claude-codecodexcursorgemini-clischemametadatabusiness-context

pm-metrics-critic

Critiques a metrics dashboard, success-criteria section, or proposed North Star metric against the repo's metrics guide. Surfaces common failures: aggregate metrics hiding segment …

claude-codecodexcursorgemini-cliproduct-managementmetricsdashboard

Run metric-driven iterative optimization loops. Define a goal, add measurement scaffolding, execute parallel experiments across approaches, score results against gates or quality j…

claude-codecodexcursorgemini-cliai:llmtype:generatoroptimization

rz-quarterly-review

Triggers on first Sunday of January/April/July/October or explicit quarterly review commands. Runs an 80-100 minute process: pulls metrics, re-scores channels on a 5-criteria frame…

claude-codecodexcursorgemini-clitype:reviewmetricsstrategy

inference-perf-baseline-bridge

Connects inference benchmark outputs to the perf-baseline registry, capturing canonical metrics (TTFT, ITL, throughput, cache hit rate) under inference_perfbench_v1 with workload-t…

claude-codecodexcursorgemini-clibenchmarkregistryttft

os-improvement-loop

Coordinates concurrent multi-agent improvement cycles using shared event bus and memory. Each cycle executes, evaluates (KEEP/DISCARD), emits friction events, persists metrics and …

claude-codecodexcursorgemini-cliai:agentimprovement-cyclemulti-agent

Designs the evaluation harness for agent loops, establishing trustworthy verification through a 7-layer suite with false-completion-rate and repair-productivity as core metrics. En…

claude-codecodexcursorgemini-cliai:agentloopsevaluation

pm-progress-auditor

Audit a status update, exec review, board email, all-hands talking point, or dashboard callout for credibility leaks before sending. Flags overstated claims, cherry-picked windows,…

claude-codecodexcursorgemini-clitype:audittype:reviewaudit

Sustained metric-improvement loop with atomic commits, auto-rollback, and experiment logging. Iterates with specialist agents, commits atomically, and auto-rolls back on regression…

claude-codecodexcursorgemini-climetricscommitsexperiments

Design or measure documentation systems: plan information architecture, mode taxonomy, README/quickstart/reference structures, tool contracts, error messaging, versioning, and acce…

claude-codecodexcursorgemini-cliai:agentinformation-architecturedocumentation

Design and operate a self-improving AI business operating system with nine integrated components: strategy, prioritization, knowledge, operations, department agents, projects, auto…

claude-codecodexcursorgemini-cliai:agentbusiness-osagentic

observabilityaudit

Comprehensive observability audit scoring 18 dimensions: logging, tracing (OpenTelemetry), metrics (RED/USE), dashboards, alerts, SLOs, error tracking, retention, sampling, probes,…

claude-codecodexcursorgemini-clitype:auditauditopentelemetry

pm-north-star-selector

Selects a single North Star metric for a product. Weighs candidates across behavioral, value-delivered, and financial dimensions, emphasizing explainability, adoption + retention c…

claude-codecodexcursorgemini-cliproduct-managementmetricsnorth-star

Guides SaaS teams on product-led growth strategy: evaluating PLG readiness, selecting freemium or trial models, defining activation and PQLs, crafting self-serve onboarding, buildi…

claude-codecodexcursorgemini-cliplgsaasgrowth

research-platform

Aggregates an operator's owned analytics, public metrics, and prior evaluations into a sourced evidence base for X, LinkedIn, TikTok, YouTube, and Instagram. Tags every data point …

claude-codecodexcursorgemini-clianalyticssocial-mediaseo

shadow-mode-runner

Coordinates SHADOW mode operation where the agent runs parallel to human input without delivering output or incurring billing. Measures agreement rates and generates promotion repo…

claude-codecodexcursorgemini-clishadowevaluationmetrics

x-tweet-search-by-query

Executes advanced X/Twitter searches via query string and returns normalized results including tweet text, author details, engagement metrics, media, and pagination cursor. Support…

claude-codecodexcursorgemini-clitwittersearchquery

experimentation

Designs and runs controlled experiments (A/B tests, RCTs, offline hypothesis tests) including hypothesis framing, randomization, power analysis, metric selection, variance reductio…

claude-codecodexcursorgemini-clia/b-testingstatisticsrct

performance-budgets

Define, track, and enforce performance thresholds across time, size, and count dimensions using metrics, thresholds, percentiles, and consequences. Covers Core Web Vitals, RAIL, Li…

claude-codecodexcursorgemini-clibudgetscore-web-vitalsmetrics

Generates a 5-dimension harness readiness scorecard (harnessFit, compileConfidence, taskCoverage, toolSafety, memoryUsefulness) plus estimated cost and scaffold readiness from a gi…

claude-codecodexcursorgemini-clitype:generatorscorecardreadiness

pm-experimentation-ab

Designs and reviews A/B tests with statistical rigor: pre-registered hypotheses, power analysis, primary metrics with guardrails, segment reads, and clear iterate/pivot/persevere d…

claude-codecodexcursorgemini-clitype:reviewa-b-testingexperimentation

datajunction-query

Query DataJunction nodes, generate SQL, fetch metric data, explore lineage, and visualize results through APIs or compatible tools. Pair with datajunction for concepts, datajunctio…

claude-codecodexcursorgemini-cliquerysql-generationmetrics

Defines five analyst operating modes (Query, Dashboard, Document Compile, Extract, Challenge) with procedures, output formats, and metrics. Includes write-gates for dashboard and s…

claude-codecodexcursorgemini-cliai:claudemodesworkflows

pm-okr-metric-validity-audit

Runs structured validity audits on OKRs, KPIs, North Star Metrics, or success-metric sets. Flags vanity metrics, unfalsifiable results, output-vs-outcome confusion, gameable target…

claude-codecodexcursorgemini-clitype:audittype:reviewokr

professional-indemnity-profit-per

Captures near-misses, claim letters, insurance notifications, and lessons learned. Equips managing partners, management committees, and COO/CFO roles in German mid-sized law firms …

claude-codecodexcursorgemini-cliinsurancelaw firmrisk management

equity-partner-modell

Analyzes equity structures, fixed-share models, salary partner tracks, counsel roles, and partner entry/exit scenarios for mid-sized German law firms, delivering metrics, decision …

claude-codecodexcursorgemini-clilawpartnershipgermany

salesforce-agentforce-stdm-observer-skill

Monitors live Salesforce Agentforce sessions via STDM and Data Cloud, surfacing faithfulness scores, action telemetry, and quality metrics under least-privilege access. Answers rea…

claude-codecodexcursorgemini-clitool:salesforcetype:reviewsalesforce

forge-observability

Production observability with OpenTelemetry covering traces, metrics, and logs with correlation. Includes SDK initialization, span conventions, error handling, RED/USE metrics, sam…

claude-codecodexcursorgemini-clitype:auditopentelemetrytracing

github-dashboard

GitHub repository analytics dashboard — stars, forks, contributors, issues, pull requests, recent activity, and top contributors. Use when the brief asks for a GitHub repo dashboar…

claude-codecodexcursorgemini-clitool:githubgithubanalytics

Write testable product hypotheses with clear success metrics, baselines, targets, and timeframes. Produces a structured statement, supporting evidence, validation plan with method …

claude-codecodexcursorgemini-clihypothesisexperimentationvalidation

token-defaults-score

Runs a repeatable audit that turns every safe token-saving default on, locks it against regression, and tracks the rest as roadmap items—without shipping unwitnessed claims. Re-mea…

claude-codecodexcursorgemini-clitype:audittokensdefaults

Lightweight per-arm turn-log analyzer reporting billable turns, HTTP status counts, cache metrics with 5m/1h split, token-weighted hit rate, and thinking budget. Safe on live NDJSO…

claude-codecodexcursorgemini-clianalyticsmetricsperformance

role-redesign-for-ai

Redesigns a role after AI has shifted its workload — mapping pre/post task inventories, redefining core responsibilities, and updating metrics plus growth paths. Use when AI change…

claude-codecodexcursorgemini-clirole-designworkforce-transformationai-adoption

dos-self-improve

Runs an isolated, kernel-driven self-improvement loop: proposes changes, verifies them in clean worktrees, and keeps only those where an independent witness confirms metric gains a…

claude-codecodexcursorgemini-clidosself-improvementmetrics

voice-agent-design

Design voice AI agents for phone or in-app use: conversation flows, interruption handling, escalation logic, and metrics that flag poor caller experience. Outputs specs covering pe…

claude-codecodexcursorgemini-cliai:agenttype:reviewvoice-ai

eval-result-interpreter

Analyzes AI agent evaluation pass/fail results from CSV exports or custom evaluators using triage frameworks to deliver SHIP/ITRATE/BLOCK verdicts, root cause analysis, mode classi…

claude-codecodexcursorgemini-clitype:debugevalstriage

Use when the task involves defining, calculating, or implementing business metrics or KPIs. Covers KPI definition, SQL metric logic, Excel formulas, churn, retention, revenue, conv…

claude-codecodexcursorgemini-clitype:reviewkpimetrics

simplicio-autoresearch

Evolutionary optimize-by-metric loop that mutates targets, evaluates against fixed criteria, commits on improvement or reverts via git, and breaks plateaus after stagnation. Includ…

claude-codecodexcursorgemini-clioptimizationmutationgit

Analyzes completed PRs to audit AI behavior by extracting autonomous decisions, assumptions, and spec deviations from git logs, diffs, and PR bodies. Generates structured control l…

claude-codecodexcursorgemini-clipr-auditgovernancecontrol-log

stream-aggregation-helper

Design and tune VictoriaMetrics stream aggregation rules to cut cardinality, sampling rate, or query load. Handles vmagent config, metric aggregation choices, interval tuning, pipe…

claude-codecodexcursorgemini-clivictoriametricsmetricsaggregation

Configures Grafana Alloy for OpenTelemetry collection and telemetry pipelines. Supports the Alloy language, components for metrics/logs/traces/profiles, data export to Grafana Clou…

claude-codecodexcursorgemini-cligrafana-alloyopentelemetrytelemetry

metricflow_ingest

Maps MetricFlow semantic models and metrics into ktx semantic layer sources. Handles primitive tables, inheritance flattening, metric types, model refs, and provides worked example…

claude-codecodexcursorgemini-climetricflowsemantic-layermetrics

Assesses individual contributions across a configurable window (default 2 weeks). Generates contributor metrics including merged PRs, review cycles, issue throughput, participation…

claude-codecodexcursorgemini-clitype:reviewperformancemetrics

Enforces data engineering standards: warehouse access is read-only, queries follow sample-then-scale, every metric links to logged query and data hash, evaluations stay isolated fr…

claude-codecodexcursorgemini-clidata-engineeringwarehousemetrics

Define or review OKRs, KPIs, and North Star Metrics from product strategy. Enforces outcome-focused key results with baselines, targets, and one objective per team per cycle, balan…

claude-codecodexcursorgemini-clitype:reviewokrkpi

formatting-and-highlighting

Provides formatting rules for metrics: decimals, prefixes/suffixes, currency, percentages, scaling (K/M/bp), separators, sign handling, and display modes including rich text, URLs,…

claude-codecodexcursorgemini-climetricsformattingdisplay

把内容创作变成可校准的预测循环——打分 → 盲预测 → T+3d 复盘 → 进化 rubric，适用任何能被量化（播放/阅读/收听/点击）的内容；内置一份观点视频 rubric，其他形态可借此起步。触发词："初始化"/"打分这篇"/"启动预测"/"已发布"/"复盘"/"升级 rubric"/"推荐选题"/"抓热点"/"挖问题"/"状态"/"找对标"/"lea…

claude-codecodexcursorgemini-clicontentpredictionrubric

Designs and implements rigorous evaluations for LLM agents, multi-agent systems, skills, and prompts—covering frameworks like DeepEval, Braintrust, and RAGAS plus metrics such as p…

claude-codecodexcursorgemini-cliai:agentllmevaluation

promotion-case-builder

Builds a structured promotion case document including accomplishments, metrics, scope evidence, stakeholder impact, and compensation context, with a clear request for advancement. …

claude-codecodexcursorgemini-clitype:reviewcareerpromotion

Computes DORA and Flow Framework metrics—cycle time, lead time, throughput, WIP, flow efficiency—from Jira changelogs, optionally joined with Jira Align for program/portfolio rollu…

claude-codecodexcursorgemini-clidorajirametrics

modeling-pigment-applications

Provides the mental model and decision framework for designing Pigment applications, covering core concepts like dimensions, metrics, transaction lists, sparsity, and scope, plus c…

claude-codecodexcursorgemini-clipigmentbidimensions

Creates a new easy-db-lab kit (kit.yaml, K8s manifests, metrics, dashboards, docs) for any database or workload. Detects internal vs external mode, researches the workload, tracks …

claude-codecodexcursorgemini-clitype:reviewkubernetesyaml

gitlab-portfolio

Aggregates cross-repo health signals from GitLab and GitHub projects registered in a vault. Scans frontmatter for repo metadata, fetches open issues/MRs and stale indicators via pa…

claude-codecodexcursorgemini-clitool:gitlabgitlabgithub

Analyzes system performance and failure patterns to autonomously improve skill prompts. Reads logs, identifies weak skills, rewrites prompts, commits changes, and rolls back if met…

claude-codecodexcursorgemini-cliself-optimizepromptslogs

state-estimator-evaluate-bags

Evaluate Moleworks ROS2 mole_estimator performance on MCAP/rosbag2 datasets by replaying sensor bags, recording reprocessed outputs with state and graph topics, then running offlin…

claude-codecodexcursorgemini-cliros2mcaprosbag

Query and manage Libra/DataTester A/B experiments including details, traffic allocation, app lists, parameter-path search, reports, metric groups, realtime dashboards, and test use…

claude-codecodexcursorgemini-cliab-testingexperimentsmetrics

Showing the top 60 of 1,355. See the full list →