วิธีการที่แตกต่างกันของการให้คะแนนการทดสอบมาตรฐานใช้ร้อยละค่าเฉลี่ยบรรทัดฐานระดับเกรดข้อกำหนดด้านประสิทธิภาพที่เฉพาะเจาะจงและคะแนนดิบ การทดสอบมาตรฐานส่วนใหญ่เกี่ยวข้องกับการใช้คำถามปรนัยที่ต้องตอบภายในกรอบเวลาที่แน่นอน โดยทั่วไปจะมีการประเมินและให้คะแนนโดยโปรแกรมคอมพิวเตอร์ คะแนนการทดสอบที่ได้มาตรฐานบางอย่างรวมมากกว่าหนึ่งวิธี
หนึ่งในวิธีการทั่วไปของการให้คะแนนการทดสอบที่ได้มาตรฐานคือการใช้คะแนนดิบ สิ่งนี้เกี่ยวข้องกับการใช้จำนวนคำถามที่ตอบไม่ถูกต้องและลบตัวเลขนั้นออกจากจำนวนคำถามทั้งหมดในแบบทดสอบ คะแนนดิบตรงกับจำนวนคำถามที่ผู้ทดสอบตอบอย่างถูกต้อง
คะแนนดิบสามารถแปลเป็นร้อยละด้วยวิธีการให้คะแนนการทดสอบมาตรฐานอื่น เปอร์เซ็นไทล์บางอย่างเกี่ยวข้องโดยตรงกับคะแนนดิบโดยเฉพาะ เปอร์เซนต์เหล่านี้มักจะระบุจำนวนผู้ทำแบบทดสอบที่ทำคะแนนได้หรือต่ำกว่าคะแนนดิบที่เกี่ยวข้อง ตัวอย่างเช่นผู้ทำแบบทดสอบที่ทำคะแนนได้ 45 คะแนนในส่วนของแบบทดสอบที่ได้มาตรฐานสำหรับการเข้าเรียนในวิทยาลัยอาจได้รับค่าเปอร์เซ็นไทล์ของ 80 ซึ่งหมายความว่ามีเพียง 20 เปอร์เซ็นต์ของผู้ทำแบบทดสอบที่ทำคะแนนได้มากกว่า 45
ค่าเฉลี่ยเป็นอีกวิธีหนึ่งในการให้คะแนนการทดสอบที่ได้มาตรฐาน คะแนนประเภทนี้มักจะได้รับการจัดตั้งขึ้นสำหรับสาขาวิชาที่แตกต่างกัน ผู้ทดสอบที่ทำคะแนนสูงกว่าหรือต่ำกว่าค่าเฉลี่ยจะได้รับคะแนนเบี่ยงเบนจากค่าเฉลี่ย การทดสอบ IQ เป็นตัวอย่างของการทดสอบมาตรฐานที่ใช้วิธีการเฉลี่ย อะไรที่มากกว่า 100 ถือว่าเป็นคะแนนเฉลี่ยสูงกว่า
อีกตัวอย่างหนึ่งของการใช้ค่าเฉลี่ยในการทดสอบมาตรฐานคือการสอบที่จำเป็นในการเข้าสู่หลักสูตรระดับบัณฑิตศึกษาส่วนใหญ่ เกณฑ์การให้คะแนนขึ้นอยู่กับเกณฑ์มาตรฐานโดยเฉลี่ย 500 ผู้ทำแบบทดสอบสามารถเบี่ยงเบนจากค่าเฉลี่ยนั้นได้ 300 คะแนน คะแนนขั้นต่ำคือ 200 และสูงสุดคือ 800
ค่าเฉลี่ยระดับเกรดอาจแสดงเป็นเปอร์เซนต์หรือตัวเลข วิธีนี้ใช้เพื่อแสดงให้เห็นว่าคะแนนของผู้ทำแบบทดสอบแตกต่างจากคู่แข่งอย่างไร ตัวอย่างเช่นการทดสอบที่ได้มาตรฐานสำหรับนักเรียนระดับประถมศึกษาอาจแสดงเปอร์เซ็นต์ของแต่ละส่วนการทดสอบที่ระบุจำนวนนักเรียนในระดับชั้นเดียวกันที่ทำคะแนนต่ำกว่าหรือสูงกว่าคะแนนของเขา
การทดสอบมาตรฐานบางอย่างนั้นทำคะแนนตามข้อกำหนดด้านประสิทธิภาพที่กำหนด คะแนนเป้าหมายอาจถูกกำหนดและสิ่งใดที่สูงหรือต่ำกว่าคะแนนนั้นจะถือเป็นส่วนเบี่ยงเบน ตัวอย่างเช่นอาจพิจารณาได้ว่าคะแนนที่น่าพอใจในการสอบเรียงความเทียบเท่ากับคะแนนสามคะแนน สูงกว่าค่าเฉลี่ยบทความจะได้รับคะแนนสี่หรือสูงกว่าในขณะที่การส่ง subpar อาจได้รับคะแนนสองหรือหนึ่ง


