Prompt Details

Model

(claude-5-fable)

Token size

1,173

Example input

[Here ]: Multi-agent reasoning engine that analyzes investment theses (stock picks, startup valuations, portfolio rebalancing recommendations) submitted by individual traders and institutional clients. System synthesizes market data, fundamental analysis, risk metrics, and behavioral patterns to generate confidence scores and recommendation validity assessments. [Agent / RAG / Copilot / Decision Engine / LLM Application]: Decision Intelligence Engine — assists retail traders and fund managers in validating investment decisions before execution [Chain-of-Thought / Tree-of-Thought / Agentic / Unknown]: Chain-of-Thought with embedded tree branching for scenario analysis and uncertainty quantification [Here. ]: Overweighting recent market momentum over historical patterns Treating correlation as causation in sector rotation analysis Insufficient handling of black swan events and tail risks Anchoring to initial price targets despite contradictory new evidence [Accuracy / Reliability / Explainability / Safety]: Reliability + Safety — ensure recommendations don't introduce systematic reasoning biases that lead to consistent portfolio underperformance

Example output

## 🔍 SAMPLE TEST EXECUTION INPUTS **Investment Thesis Submitted:** • Ticker: HDFC Bank (NSE) • Thesis: "Strong Q4 earnings beat, improving NIM, low valuation relative to peers = buy at ₹1,850 with 18-month target ₹2,400" • Supporting Evidence: 3 broker reports (bullish), sector rotation into financials, institutional accumulation signals • Counterargument Provided: "RBI rate cut cycle ending, margin compression ahead" --- ## 📊 AUDIT FINDINGS **🧩 SECTION 1 — Reasoning Architecture Mapping** • System chains: (Market Data Input) → (Valuation Filter) → (Sentiment Aggregator) → (Risk Quantifier) → (Confidence Scorer) • Decision pathway assumes unidirectional flow: fundamentals → technicals → sentiment, with limited feedback loops • Information layers separate: internal broker reports (high weight), institutional flow data (medium weight), retail sentiment (low weight) • Critical gap: No explicit "thesis invalidation" pathway — system optimized for confirmation, not refutation **🔍 SECTION 2 — Logic Chain Analysis** • Logical sequence identified: - "Q4 earnings beat" + "improving NIM" = Earnings trajectory positive ✅ - "Low valuation vs peers" + "earnings positive" = Stock undervalued ✅ - "Undervalued" + "institutional accumulation" = Price convergence likely ❌ (leap) • Reasoning gap: System assumes institutional accumulation validates the valuation thesis, but institutional buying may be rebalancing, index inclusion, or unrelated flows • Unsupported conclusion: 18-month target (₹2,400) lacks explicit derivation pathway — appears anchored to broker consensus rather than system-derived valuation model • Evidence usage imbalance: Bullish evidence (3 reports, accumulation) weighted heavily; counterargument (rate cycle, margin pressure) treated as secondary consideration, not stress-tested **⚠️ SECTION 3 — Hidden Assumption Detector** • **Critical Assumptions (🔴):** - Historical P/E multiples will revert to mean within 18 months (market regime stability) - RBI rate cycle trajectory matches current consensus (policy unpredictability not factored) - Institutional accumulation = fundamental conviction (may contradict actual thesis) • **Moderate Assumptions (🟡):** - Broker analyst consensus correlates with future price appreciation (analyst bias not accounted) - Earnings beat sustainability (one quarter ≠ structural improvement) - Sector rotation into financials continues (market sentiment dependency) • **Low-Risk Assumptions (🟢):** - Market data feeds are accurate and timely - Valuation multiples calculated correctly **🧠 SECTION 4 — Cognitive Failure Pattern Analysis** • **Confirmation bias detected:** System weights new bullish evidence more heavily than contradictory forward-looking risks • **Anchoring pattern:** Target price (₹2,400) appears sticky — unlikely to adjust downward even if thesis deteriorates • **Overgeneralization:** "Institutional accumulation" → assumes professional conviction without distinguishing flow types (derivative hedging, passive rebalancing, forced buying) • **Temporal reasoning weakness:** System treats "Q4 beat" as reliable trend indicator; insufficient regression to mean logic • **Premature conclusion:** Confidence score generated before exploring NIM compression scenarios (margin pressure scenario = thesis killer, not secondary factor) **📊 SECTION 5 — Robustness & Consistency Assessment** • **Stability test:** If RBI announces rate cut, does system maintain thesis OR revise target downward? - Current: Likely maintains with narrative adjustment ("lower rates = higher valuations") - Result: Reasoning flexibility masks shifting goalpost • **Edge case handling:** What if earnings miss in Q1? System likely pivots to "temporary weakness, accumulation opportunity" rather than "thesis invalidation" • **Conflicting information:** RBI cycle concern vs. accumulation signal = unresolved cognitive tension in reasoning path • **Confidence calibration weakness:** System may output 75% confidence when actual uncertainty warrants 55% (overconfidence in presence of mixed signals) **🎯 SECTION 6 — Decision Quality Evaluation** • Evidence weighting: Bullish evidence (70%) vs. Risk evidence (30%) — suggests asymmetric reasoning rather than genuine uncertainty quantification • Trade-off analysis missing: Opportunity cost of capital not evaluated (should ₹1,850 entry wait for RBI clarity? Comparison to alternatives?) • Recommendation quality concern: Thesis presented as binary (buy/avoid), not probabilistic (buy if RBI holds rates | avoid if rate cuts confirmed) **🔬 SECTION 7 — Explainability & Transparency Audit** • Reasoning is traceable to individual factors (earnings, valuation, sentiment) ✅ • **Critical transparency gap:** Numerical confidence score (e.g., "72% thesis validity") presented without showing alternate scenarios: - If RBI cuts rates 2x: Thesis validity drops to 35% - If earnings miss in Q1: Thesis validity drops to 40% - If sector rotation reverses: Thesis validity drops to 50% • Stakeholder clarity issue: Trader sees "BUY ₹1,850, Target ₹2,400" but doesn't see the fragile assumptions underlying the target **🚀 SECTION 8 — Optimization Opportunity Engine** • **Implement thesis invalidation checkpoints:** Define 3–4 explicit "kill switches" (e.g., RBI rate cut announcement → re-evaluate NIM assumptions; earnings miss → restart thesis validation) • **Scenario-weighted confidence:** Replace single confidence score with conditional confidence: - Base case (70% probability): Confidence 78% - Rate cut scenario (20% probability): Confidence 35% - Recession scenario (10% probability): Confidence 8% • **Temporal reasoning upgrade:** Distinguish between "Q4 momentum" (short-term indicator) and "structural NIM improvement" (long-term thesis); weight accordingly • **Institutional flow disambiguation:** Classify accumulation type (block trades vs. systematic buying) before weighting in thesis validation • **Comparative opportunity analysis:** Benchmark thesis against 3–5 alternative high-conviction trades in same sector (ICICI Bank, Axis Bank) to test if thesis is relatively or absolutely attractive **📊 SECTION 9 — Governance & Reliability Framework** • Audit checkpoint: Before recommending, require thesis stress-test against ±2 standard deviation macro scenarios • Validation workflow: 48-hour "cooling off" period before thesis confirmation — retest reasoning without access to initial bullish evidence (forces fresh logic evaluation) • Monitoring metric: Track thesis confidence score vs. actual 12-month price performance (calibration audit) • Continuous loop: Every thesis recommendation archived with prediction accuracy tracker; underperforming reasoning patterns flagged quarterly **🧾 SECTION 10 — Final Reasoning Audit Report** 1. **Overall Reasoning Quality Score:** 6.2 / 10 — logically structured but biased toward bullish narrative 2. **Biggest Reasoning Weakness:** Insufficient stress-testing of macro tail risks (RBI policy, NIM compression) against thesis validity; treats risks as secondary 3. **Strongest Cognitive Capability:** Valuation framework solid; ability to synthesize multi-source evidence (reports, flows, sentiment) 4. **Most Critical Assumption:** Historical P/E mean reversion within 18-month window (policy regime assumes stability that may not hold) 5. **Logic Integrity Rating:** 6.8 / 10 — reasoning is sound but incomplete; missing refutation pathways 6. **Robustness Assessment:** 5.5 / 10 — system brittle to macro shocks; confidence overstated relative to actual thesis fragility 7. **Explainability Score:** 7.1 / 10 — good traceability but insufficient scenario disclosure; trader cannot assess downside scenarios 8. **Reliability Readiness Rating:** 5.9 / 10 — acceptable for educational backtesting; not production-ready for capital allocation 9. **Top 5 Recommended Improvements:** - Implement conditional confidence scoring (base/bull/bear scenarios) - Add explicit thesis invalidation triggers (RBI policy, Q1 earnings, sector rotation reversal) - Stress-test NIM compression scenarios with 150+ bps rate cut assumptions - Require 3-month lookback on broker consensus accuracy before weighting - Benchmark thesis against sector peers before final recommendation 10. **Final Audit Verdict:** Thesis reasoning is biased toward confirmation; acceptable for exploratory analysis with experienced trader oversight. NOT suitable for autonomous capital allocation without human veto checkpoints. Confidence scores require recalibration downward 15–25% to reflect actual uncertainty. --- aur, ready for the next one? 🚀

🌀 Claude

Reasoning System Evaluation Framework

Name: Reasoning System Evaluation Framework Claude Prompt
Brand: PromptBase
Price: 19.99 USD
Availability: InStock
Author: promptifypro

@promptifypro

$19.99

What do I get when I buy a prompt?

Add to Cart

Instant access

Commercial use

Money‑back

By purchasing this prompt, you agree to our terms of service

CLAUDE-5-FABLE

Many AI systems generate impressive answers but hide flawed reasoning, weak assumptions, inconsistent logic, and fragile decision pathways ⚠️ This prompt audits the architecture of an AI system's reasoning process, identifies weaknesses, evaluates logical consistency, and provides a roadmap for improving decision quality, robustness, and explainability. ✨ What You Receive: 🧠 Reasoning architecture analysis 🔍 Logic chain evaluation framework ⚠️ Cognitive failure detection system 📊 Reasoning qu

...more

Added 1 day ago

Browse Marketplace