2019年8月1日 ETS宣布托福考试改革,整体来说,考试稍微更容易些了,改革后的考题删减了,考试时间也缩减到了3小时。自2006年ETS将paper-based test纸笔考试改成Internet-based test网路考试以来,长达时隔13年后ETS做出的大改革,让我们来看看新版的托福考试有哪些改变。
Table of contents
托福考试时间缩短
首先,可以发觉考试的题目被删除了一些,更加精简了,整体的考试时间也缩短了半个钟头。
项目 | 2019年8月1 日前 | 2019年8月1 日后 |
---|---|---|
阅读 Reading | 阅读文章: 3-4篇 每篇: 12-14道题 时长: 50-80分钟 | 阅读文章: 3-4篇 每篇: 10道题 时长: 50-80分钟 |
听力 Listening | 4-6 段对话. (6道题/段) 2-3 段对话. (5道题/段) 时长: 60-90 分钟 | 3-4 段对话. (6道题/段) 2-3 段对话. (5道题/段) 41 – 57 分钟 |
口语 Speaking | 问题: 6个. 2个独立题, 4 个综合题 时长: 20分钟 | 问题: 4个 1 个独立题, 3 个综合题 时长: 17分钟 |
写作 Writing | 2道题 1个独立题, 1个综合题 50分钟 | 保持不变 |
总时长 | 3.5小时 | 3小时 |
成绩单可拼分 默认MyBest Scores
接下来是很多同学最激动的成绩单可合併的政策。 托福成绩单採取MyBest Scores,ETS官方默认对于托福成绩进行「拼分」,直接在成绩单上给出「拼分」后的成绩。2019年8月开始实行。
下面是ETS官方提供的举例,某位考生进行了三次托福考试:
Section | Test Date One | Test Date Two | Test Date Three | MyBestScores |
---|---|---|---|---|
Reading | 24 | 23 | 23 | 24 |
Listening | 19 | 20 | 22 | 22 |
Speaking | 20 | 20 | 21 | 21 |
Writing | 21 | 23 | 22 | 23 |
Total Score | 84 | 86 | 88 | 90 |
第一次考试,阅读最高分,总成绩84分;第二次考试写作最高分,总成绩86分;第三次考试听力与口语分数最高,总成绩88分,透过MyBestScores的默认打分机制,总成绩达到了90分。
但事实上这名考生,没有任何一次真实的托福成绩考到90分,然而透过三次考试保留最好的单项成绩后,ETS新的机制组合给出了90分,这就是拼分! 假设所申请的学校接受拼分成绩单,那对拼分模式于考生来说真的是非常有帮助的!
特别注意:不是每一所学校都接受拼分成绩单,有学校是拒绝拼分的。请务必在申请学校的时候,查大学官网,以及给学校发邮件来询问和确认是否接受「拼分」。
阅读: 减少题目数
阅读文章数不变、阅读加试不变,减少题目数
项目 | 2019年8月1 日前 | 2019年8月1 日后 |
---|---|---|
阅读 Reading | 阅读文章: 3-4篇 每篇: 12-14道题 时长: 50-80分钟 | 阅读文章: 3-4篇 每篇: 10道题 时长: 50-80分钟 |
- 没有加试的话,考试时间从原来的60分钟减少到54分钟。
- 有加试的话,考试时间从原来的80分钟减少到72分钟。
- 阅读从原来的每篇14题,减少到每篇10题,大概率插入句子题和summary题不会去掉,去掉的就是细节题,单词题,推断题,指代题。
注意,此处所有题型都还有包括单词题,细节题,指代题,推断题,只是减少这些题目的题目数量和所佔比例。
听力: 减少题目数
听力的Conversation不变,听力题目数不变,减少Lecture数量。
项目 | 2019年8月1 日前 | 2019年8月1 日后 |
---|---|---|
听力 Listening | 4-6 段对话. (6道题/段) 2-3 段对话. (5道题/段) 时长: 60-90 分钟 | 3-4 段对话. (6道题/段) 2-3 段对话. (5道题/段) 41 – 57 |
改革后的听力测验,主要分为2个sections,第1个是小section,第2个是大section
Conversation和Lecture题目数没变,每个conversation,5道题,每个Lecture6道题,
先考小section
由1个Conversation和1个Lecture所组成。一共是11道题。
后考大section
由1个Conversation和2个Lecture所组成。一共是17道题。
如果再有加试的话,就再多一个小Section,由1个Conversation和1个Lecture所组成。一共是11道题。
口语: 减少题目数
口语从6个任务题,删减成了4个。其中原本的独立任务1与综合任务5题型被删除,保留的四道题,依照顺序重新命名成新的1,2,3,4题。
项目 | 2019年8月1 日前 | 2019年8月1 日后 |
---|---|---|
口语 Speaking | 问题: 6个. 2个独立题, 4 个综合题 时长: 20分钟 | 问题: 4个 1 个独立题, 3 个综合题 时长: 17分钟 |
独立任务 Task 1
独立任务 Task 2 → 更改为: 独立任务 Task 1
综合任务 Task 3 →更改为: 综合任务 Task 2
综合任务 Task 4 → 更改为: 综合任务 Task 3综合任务 Task 5
综合任务 Task 6 → 更改为: 综合任务 Task 4
口语评分: 电脑与人类共同评分
以往口语考试是由两位考官给出的分数平均值计分,改革后ETS推出了SpeechRater电脑评分系统。 每个答案只会有一位真人评分考官 (One Human Rater)进行评分。所以你的发音现在变得更加重要,如果电脑系统无法清晰判断你的发音,那么你的分数可能会被拉低。
如果你想提升自己的英文口语发音,helloTOEFL的Phoebe老师正在制作一套”基础英文字母发音教材“,建议使用学习。
据了解,智能评分引擎 Speech-Rater 一直在试验试用中,在过往的考试中一直在使用调整,ETS这次改革后正式纳入评分流程,说明系统已经稳定。
最新的口语评分流程也将更改为:
每道口语任务题目的分数,由两部分组成:
真人考官所给的分数 + 电脑AI系统Speech-Rater评分
一个考生的4道题的口语答案,将会由4个不同的考官来评分,每一道题都是“电脑评分+人类考官评分”来完成评分,不会有考官听评同一个考生的 2 道题,更公平的删除了考官本身的主观因素。
从语言测评的角度来看,人的主观因素如疲劳、个人偏好等影响,人评分的稳定性相对来说比不上机器评分的稳定性。採用Speech-Rater共同评分的好处是:可以最大程度消除考官的人为偏见,尽可能缩小由于人评分带来的不稳定性,充分保证口语评分的公正与公平。
Speech Rater 评分机制解析
ETS的对于Speech Rater有发表一份官方论文,前面的22页全都是实验细节的剖析。而第23页,一共列出了整整20条,会影响最终托福口语分数的核心评分标准。透过重点讲解这份报告,我们能了解到良好的流畅度、发音、韵律、节奏以及语法和词彙量,是高分的秘诀,同时也能避开Speech Rater机评的一些雷区,来增加自己的分数潜力,比如避免不合适的停顿时间,等等。
人工智的20核心评分标准
报告的第23页,整整列出了20条会影响评分的因素,主要归类成两大分类 “表达 Delivery” 跟 “言语的使用 Language Use”。
Construct | Subconstruct | Description |
---|---|---|
Delivery | Fluency | Mean silence duration |
Fluency | Speaking rate in words per second | |
Fluency | Average of chunk length in seconds | |
Fluency | No. repetitions | |
Fluency | No. disfluencies | |
Fluency | No. silences per second | |
Fluency | No. interruption points per clause | |
Fluency | Average duration of all within-clause silences | |
Pronunciation | Total acoustic model score for all words with model trained on native data | |
Pronunciation | Total acoustic model score with model trained on nonnative data | |
Prosody | SD of power | |
Prosody | Range of normalized pitch | |
Prosody | Mean of absolute shifts of the normalized vowel durations compared to standard normalized vowel durations estimated on a native speech corpus | |
Rhythm | Raw Pairwise Variability Index for consonants | |
Rhythm | Mean deviation of distances between stressed syllables in syllables | |
Language use | Grammar | Score point with the highest grammatical similarity score |
Grammar | Mean no. dependent clauses per clause | |
Vocabulary | Score point with the highest word CVA similarity score. | |
Vocabulary | Total no. different lexical types | |
Vocabulary | Average of log frequency of word types in the response |
Delivery 表达
第一大类 Delivery——表达,又分为4个层面
- Fluency——流畅度
- Pronunciation——发音
- Prosody——韵律
- Rhythm——节奏
Language use 言语使用
第二大类是Language use——语言的使用,分为两个层面
- Grammar——语法
- Vocabulary——词彙量
请直接告诉我高分技巧与雷区
要拿到高分,必须掌握良好的口语流畅度、发音、韵律、节奏以及语法和词彙量。根据报告中的评分影响比例,我们整理出了以下四点建议:
- 避免不适当的停顿
不合适的停顿会伤害我们分数,而且停顿时间越多次,时间越长,就会使分数越底! - 增加相近的词彙量使用
Score point with the highest word CVA similarity score是评分比例第二的标准,你的单词同义词替换越多,就会帮助分数提升;相反的,如果你总用相同的单词,而不进行同意替换,那么你得到的分数就越低。 - 合理的语速
位居第三的影响因素Speaking rate in words per second,意思是你的「语速」。也就是在合理范围内,你的语速越高,所得到的分数也就越高;反之,你说话越慢,你最终得到的分数也就越低。
注意: 树赖先生的语速肯定不会高分。但这并不意味著,你要像机关枪一样拼命的说,过慢或者过快的语速都不行, 而是应该有正常的语速搭配合理的停顿。就好像写文章时需要搭配合理的标点符号。
- 英文是否地道
通过你的发音和节奏来进行判断,你的英文讲话是否地道,发音越标准,声音起伏与节奏越接近Native Speaker,那么你的分数越高。