9

ಅಧ್ಯಾಯ ಒಂಬತ್ತು

AI ತಪ್ಪು
ಮಾಡಿದಾಗ

Amateurs ನಿಂದ pros ನ ಬೇರ್ಪಡಿಸೋ
verification habits.

ಈಗಷ್ಟೇ flawless essay ಬರೆಯೋಕೆ help ಮಾಡಿದ AI, ಅದೇ confidence ನಲ್ಲಿ Napoleon Battle of Waterloo ಗೆದ್ದ ಅಂತ ಹೇಳಬಹುದು. ಅದು hesitate ಮಾಡಲ್ಲ. ತೊದಲಲ್ಲ. ಪೂರ್ತಿ fabricated "fact" ನ ಎಲ್ಲದಕ್ಕೂ use ಮಾಡೋ ಅದೇ authoritative tone ನಲ್ಲಿ ಹೇಳುತ್ತೆ. ಇದೇ AI ಜೊತೆ work ಮಾಡೋದರ ಹೃದಯದಲ್ಲಿರೋ paradox: ಅದನ್ನ useful ಮಾಡೋ ಅದೇ fluency ಅದನ್ನ dangerous ಮಾಡುತ್ತೆ.

Plausibility Truth ಅಲ್ಲ

AI models database ನಿಂದ facts retrieve ಮಾಡಲ್ಲ. ಅವು ಮುಂದಿನ most likely word predict ಮಾಡ್ತಾವೆ. ನೀನು ನಿಜವಾದ ವಿಷಯ ಬಗ್ಗೆ ಕೇಳಿದಾಗ, training data ಅವನ್ನ correct information ಕಡೆ guide ಮಾಡುತ್ತೆ. ಆದ್ರೆ ಇಲ್ಲದ ವಿಷಯ ಬಗ್ಗೆ ಕೇಳಿದಾಗ, model "ನನಗೆ ಗೊತ್ತಿಲ್ಲ" ಅನ್ನಲ್ಲ. ಸರಿಯಾದ answer ಹೇಗೆ ಕಾಣುತ್ತೋ ಅದನ್ನ generate ಮಾಡುತ್ತೆ — names, dates, ಮತ್ತು citations ಸಮೇತ. ಎಲ್ಲಾ fabricated.

AI ಎಷ್ಟು confident ಆಗಿ ಹೇಳುತ್ತೆ ಅನ್ನೋದಕ್ಕೂ ಎಷ್ಟು accurate ಇದೆ ಅನ್ನೋದಕ್ಕೂ ಯಾವುದೇ correlation ಇಲ್ಲ. ತಪ್ಪು answer ಮತ್ತು ಸರಿಯಾದ answer ಹೊರಗಿನಿಂದ ಒಂದೇ ಥರ ಕಾಣುತ್ತೆ. Tone ನಿಂದ, detail ನಿಂದ, ಅಥ್ವಾ AI ಎಷ್ಟು specific numbers include ಮಾಡಿದೆ ಅನ್ನೋದ್ರಿಂದ accuracy judge ಮಾಡೋಕಾಗಲ್ಲ. "Right ಅನ್ಸುತ್ತೆ" test worthless. ನಿನ್ನ ಏಕಮಾತ್ರ defense verification.

ಪ್ರಮುಖ ಒಳನೋಟ

AI ಗೆ truth ಅನ್ನೋ concept ಇಲ್ಲ. ಅದಕ್ಕೆ plausibility ಅನ್ನೋ concept ಇದೆ. Pattern ಗೆ fit ಆಗೋ text generate ಮಾಡುತ್ತೆ — ಆ text reality ಗೆ correspond ಆಗುತ್ತೋ ಇಲ್ಲವೋ ಅನ್ನೋದು ಬೇರೆ ವಿಷಯ.

ನಿನ್ನ detector test ಮಾಡು. ಯಾವ AI claims real, ಯಾವುವು fabricated ಅಂತ ಹೇಳಬಹುದಾ?

Debug Detective

How would you report this bug?

0 pts
Scenario 1 of 5

The Button That Does Nothing

Create Account
Submitno response

You asked the agent to build a sign-up form. The form looks great, but the "Submit" button doesn't do anything when you click it.

Submit button is unresponsive
Choose your approach
Share this course
AI ಯಿಂದ ಅತ್ಯಂತ ಹೆಚ್ಚು value ಪಡೆಯೋರು ಯಾವಾಗ trust ಮಾಡಬೇಕು ಮತ್ತು ಯಾವಾಗ verify ಮಾಡಬೇಕು ಅಂತ exactly ಕಲಿತವರು.

AI ಯಾವಾಗ wrong ಅಂತ ತಿಳಿಯೋದು ಒಂದು ದೊಡ್ಡ question ಗೆ ತೆಗೆದುಕೊಂಡು ಹೋಗುತ್ತೆ: ಅದು ಯಾವತ್ತೂ ಮಾಡೋಕಾಗದ್ದು ಏನು? ಮುಂದೆ, stubbornly, beautifully human ಆಗಿ ಉಳಿಯೋ skills explore ಮಾಡೋಣ — ಮತ್ತು ಅವು ಯಾಕೆ ಹಿಂದಿಗಿಂತ ಹೆಚ್ಚು matter ಮಾಡ್ತಾವೆ.

Eval Framework

New tool unlocked!