sẽ tích hợp trong haswell, thì họ phải tính toán trc chứ bác. đợi đến lúc dùng rồi mới làm thì chậm quá