[deb_ffmpeg.git] / ffmpeg / libavcodec / vc1_loopfilter.c

/*
 * VC-1 and WMV3 decoder
 * Copyright (c) 2011 Mashiat Sarker Shakkhar
 * Copyright (c) 2006-2007 Konstantin Shishkov
 * Partly based on vc9.c (c) 2005 Anonymous, Alex Beregszaszi, Michael Niedermayer
 *
 * This file is part of FFmpeg.
 *
 * FFmpeg is free software; you can redistribute it and/or
 * modify it under the terms of the GNU Lesser General Public
 * License as published by the Free Software Foundation; either
 * version 2.1 of the License, or (at your option) any later version.
 *
 * FFmpeg is distributed in the hope that it will be useful,
 * but WITHOUT ANY WARRANTY; without even the implied warranty of
 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
 * Lesser General Public License for more details.
 *
 * You should have received a copy of the GNU Lesser General Public
 * License along with FFmpeg; if not, write to the Free Software
 * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
 */

/**
 * @file
 * VC-1 and WMV3 loopfilter
 */

#include "avcodec.h"
#include "mpegvideo.h"
#include "vc1.h"
#include "vc1dsp.h"

void ff_vc1_loop_filter_iblk(VC1Context *v, int pq)
{
    MpegEncContext *s = &v->s;
    int j;
    if (!s->first_slice_line) {
        v->vc1dsp.vc1_v_loop_filter16(s->dest[0], s->linesize, pq);
        if (s->mb_x)
            v->vc1dsp.vc1_h_loop_filter16(s->dest[0] - 16 * s->linesize, s->linesize, pq);
        v->vc1dsp.vc1_h_loop_filter16(s->dest[0] - 16 * s->linesize + 8, s->linesize, pq);
        for (j = 0; j < 2; j++) {
            v->vc1dsp.vc1_v_loop_filter8(s->dest[j + 1], s->uvlinesize, pq);
            if (s->mb_x)
                v->vc1dsp.vc1_h_loop_filter8(s->dest[j + 1] - 8 * s->uvlinesize, s->uvlinesize, pq);
        }
    }
    v->vc1dsp.vc1_v_loop_filter16(s->dest[0] + 8 * s->linesize, s->linesize, pq);

    if (s->mb_y == s->end_mb_y - 1) {
        if (s->mb_x) {
            v->vc1dsp.vc1_h_loop_filter16(s->dest[0], s->linesize, pq);
            v->vc1dsp.vc1_h_loop_filter8(s->dest[1], s->uvlinesize, pq);
            v->vc1dsp.vc1_h_loop_filter8(s->dest[2], s->uvlinesize, pq);
        }
        v->vc1dsp.vc1_h_loop_filter16(s->dest[0] + 8, s->linesize, pq);
    }
}

void ff_vc1_loop_filter_iblk_delayed(VC1Context *v, int pq)
{
    MpegEncContext *s = &v->s;
    int j;

    /* The loopfilter runs 1 row and 1 column behind the overlap filter, which
     * means it runs two rows/cols behind the decoding loop. */
    if (!s->first_slice_line) {
        if (s->mb_x) {
            if (s->mb_y >= s->start_mb_y + 2) {
                v->vc1dsp.vc1_v_loop_filter16(s->dest[0] - 16 * s->linesize - 16, s->linesize, pq);

                if (s->mb_x >= 2)
                    v->vc1dsp.vc1_h_loop_filter16(s->dest[0] - 32 * s->linesize - 16, s->linesize, pq);
                v->vc1dsp.vc1_h_loop_filter16(s->dest[0] - 32 * s->linesize - 8, s->linesize, pq);
                for (j = 0; j < 2; j++) {
                    v->vc1dsp.vc1_v_loop_filter8(s->dest[j + 1] - 8 * s->uvlinesize - 8, s->uvlinesize, pq);
                    if (s->mb_x >= 2) {
                        v->vc1dsp.vc1_h_loop_filter8(s->dest[j + 1] - 16 * s->uvlinesize - 8, s->uvlinesize, pq);
                    }
                }
            }
            v->vc1dsp.vc1_v_loop_filter16(s->dest[0] - 8 * s->linesize - 16, s->linesize, pq);
        }

        if (s->mb_x == s->mb_width - 1) {
            if (s->mb_y >= s->start_mb_y + 2) {
                v->vc1dsp.vc1_v_loop_filter16(s->dest[0] - 16 * s->linesize, s->linesize, pq);

                if (s->mb_x)
                    v->vc1dsp.vc1_h_loop_filter16(s->dest[0] - 32 * s->linesize, s->linesize, pq);
                v->vc1dsp.vc1_h_loop_filter16(s->dest[0] - 32 * s->linesize + 8, s->linesize, pq);
                for (j = 0; j < 2; j++) {
                    v->vc1dsp.vc1_v_loop_filter8(s->dest[j + 1] - 8 * s->uvlinesize, s->uvlinesize, pq);
                    if (s->mb_x >= 2) {
                        v->vc1dsp.vc1_h_loop_filter8(s->dest[j + 1] - 16 * s->uvlinesize, s->uvlinesize, pq);
                    }
                }
            }
            v->vc1dsp.vc1_v_loop_filter16(s->dest[0] - 8 * s->linesize, s->linesize, pq);
        }

        if (s->mb_y == s->end_mb_y) {
            if (s->mb_x) {
                if (s->mb_x >= 2)
                    v->vc1dsp.vc1_h_loop_filter16(s->dest[0] - 16 * s->linesize - 16, s->linesize, pq);
                v->vc1dsp.vc1_h_loop_filter16(s->dest[0] - 16 * s->linesize - 8, s->linesize, pq);
                if (s->mb_x >= 2) {
                    for (j = 0; j < 2; j++) {
                        v->vc1dsp.vc1_h_loop_filter8(s->dest[j + 1] - 8 * s->uvlinesize - 8, s->uvlinesize, pq);
                    }
                }
            }

            if (s->mb_x == s->mb_width - 1) {
                if (s->mb_x)
                    v->vc1dsp.vc1_h_loop_filter16(s->dest[0] - 16 * s->linesize, s->linesize, pq);
                v->vc1dsp.vc1_h_loop_filter16(s->dest[0] - 16 * s->linesize + 8, s->linesize, pq);
                if (s->mb_x) {
                    for (j = 0; j < 2; j++) {
                        v->vc1dsp.vc1_h_loop_filter8(s->dest[j + 1] - 8 * s->uvlinesize, s->uvlinesize, pq);
                    }
                }
            }
        }
    }
}

void ff_vc1_smooth_overlap_filter_iblk(VC1Context *v)
{
    MpegEncContext *s = &v->s;
    int mb_pos;

    if (v->condover == CONDOVER_NONE)
        return;

    mb_pos = s->mb_x + s->mb_y * s->mb_stride;

    /* Within a MB, the horizontal overlap always runs before the vertical.
     * To accomplish that, we run the H on left and internal borders of the
     * currently decoded MB. Then, we wait for the next overlap iteration
     * to do H overlap on the right edge of this MB, before moving over and
     * running the V overlap. Therefore, the V overlap makes us trail by one
     * MB col and the H overlap filter makes us trail by one MB row. This
     * is reflected in the time at which we run the put_pixels loop. */
    if (v->condover == CONDOVER_ALL || v->pq >= 9 || v->over_flags_plane[mb_pos]) {
        if (s->mb_x && (v->condover == CONDOVER_ALL || v->pq >= 9 ||
                        v->over_flags_plane[mb_pos - 1])) {
            v->vc1dsp.vc1_h_s_overlap(v->block[v->left_blk_idx][1],
                                      v->block[v->cur_blk_idx][0]);
            v->vc1dsp.vc1_h_s_overlap(v->block[v->left_blk_idx][3],
                                      v->block[v->cur_blk_idx][2]);
            if (!(s->flags & CODEC_FLAG_GRAY)) {
                v->vc1dsp.vc1_h_s_overlap(v->block[v->left_blk_idx][4],
                                          v->block[v->cur_blk_idx][4]);
                v->vc1dsp.vc1_h_s_overlap(v->block[v->left_blk_idx][5],
                                          v->block[v->cur_blk_idx][5]);
            }
        }
        v->vc1dsp.vc1_h_s_overlap(v->block[v->cur_blk_idx][0],
                                  v->block[v->cur_blk_idx][1]);
        v->vc1dsp.vc1_h_s_overlap(v->block[v->cur_blk_idx][2],
                                  v->block[v->cur_blk_idx][3]);

        if (s->mb_x == s->mb_width - 1) {
            if (!s->first_slice_line && (v->condover == CONDOVER_ALL || v->pq >= 9 ||
                                         v->over_flags_plane[mb_pos - s->mb_stride])) {
                v->vc1dsp.vc1_v_s_overlap(v->block[v->top_blk_idx][2],
                                          v->block[v->cur_blk_idx][0]);
                v->vc1dsp.vc1_v_s_overlap(v->block[v->top_blk_idx][3],
                                          v->block[v->cur_blk_idx][1]);
                if (!(s->flags & CODEC_FLAG_GRAY)) {
                    v->vc1dsp.vc1_v_s_overlap(v->block[v->top_blk_idx][4],
                                              v->block[v->cur_blk_idx][4]);
                    v->vc1dsp.vc1_v_s_overlap(v->block[v->top_blk_idx][5],
                                              v->block[v->cur_blk_idx][5]);
                }
            }
            v->vc1dsp.vc1_v_s_overlap(v->block[v->cur_blk_idx][0],
                                      v->block[v->cur_blk_idx][2]);
            v->vc1dsp.vc1_v_s_overlap(v->block[v->cur_blk_idx][1],
                                      v->block[v->cur_blk_idx][3]);
        }
    }
    if (s->mb_x && (v->condover == CONDOVER_ALL || v->over_flags_plane[mb_pos - 1])) {
        if (!s->first_slice_line && (v->condover == CONDOVER_ALL || v->pq >= 9 ||
                                     v->over_flags_plane[mb_pos - s->mb_stride - 1])) {
            v->vc1dsp.vc1_v_s_overlap(v->block[v->topleft_blk_idx][2],
                                      v->block[v->left_blk_idx][0]);
            v->vc1dsp.vc1_v_s_overlap(v->block[v->topleft_blk_idx][3],
                                      v->block[v->left_blk_idx][1]);
            if (!(s->flags & CODEC_FLAG_GRAY)) {
                v->vc1dsp.vc1_v_s_overlap(v->block[v->topleft_blk_idx][4],
                                          v->block[v->left_blk_idx][4]);
                v->vc1dsp.vc1_v_s_overlap(v->block[v->topleft_blk_idx][5],
                                          v->block[v->left_blk_idx][5]);
            }
        }
        v->vc1dsp.vc1_v_s_overlap(v->block[v->left_blk_idx][0],
                                  v->block[v->left_blk_idx][2]);
        v->vc1dsp.vc1_v_s_overlap(v->block[v->left_blk_idx][1],
                                  v->block[v->left_blk_idx][3]);
    }
}

static av_always_inline void vc1_apply_p_v_loop_filter(VC1Context *v, int block_num)
{
    MpegEncContext *s  = &v->s;
    int mb_cbp         = v->cbp[s->mb_x - s->mb_stride],
        block_cbp      = mb_cbp      >> (block_num * 4), bottom_cbp,
        mb_is_intra    = v->is_intra[s->mb_x - s->mb_stride],
        block_is_intra = mb_is_intra >> block_num, bottom_is_intra;
    int idx, linesize  = block_num > 3 ? s->uvlinesize : s->linesize, ttblk;
    uint8_t *dst;

    if (block_num > 3) {
        dst      = s->dest[block_num - 3];
    } else {
        dst      = s->dest[0] + (block_num & 1) * 8 + ((block_num & 2) * 4 - 8) * linesize;
    }
    if (s->mb_y != s->end_mb_y || block_num < 2) {
        int16_t (*mv)[2];
        int mv_stride;

        if (block_num > 3) {
            bottom_cbp      = v->cbp[s->mb_x]      >> (block_num * 4);
            bottom_is_intra = v->is_intra[s->mb_x] >> block_num;
            mv              = &v->luma_mv[s->mb_x - s->mb_stride];
            mv_stride       = s->mb_stride;
        } else {
            bottom_cbp      = (block_num < 2) ? (mb_cbp               >> ((block_num + 2) * 4))
                                              : (v->cbp[s->mb_x]      >> ((block_num - 2) * 4));
            bottom_is_intra = (block_num < 2) ? (mb_is_intra          >> (block_num + 2))
                                              : (v->is_intra[s->mb_x] >> (block_num - 2));
            mv_stride       = s->b8_stride;
            mv              = &s->current_picture.motion_val[0][s->block_index[block_num] - 2 * mv_stride];
        }

        if (bottom_is_intra & 1 || block_is_intra & 1 ||
            mv[0][0] != mv[mv_stride][0] || mv[0][1] != mv[mv_stride][1]) {
            v->vc1dsp.vc1_v_loop_filter8(dst, linesize, v->pq);
        } else {
            idx = ((bottom_cbp >> 2) | block_cbp) & 3;
            if (idx == 3) {
                v->vc1dsp.vc1_v_loop_filter8(dst, linesize, v->pq);
            } else if (idx) {
                if (idx == 1)
                    v->vc1dsp.vc1_v_loop_filter4(dst + 4, linesize, v->pq);
                else
                    v->vc1dsp.vc1_v_loop_filter4(dst,     linesize, v->pq);
            }
        }
    }

    dst -= 4 * linesize;
    ttblk = (v->ttblk[s->mb_x - s->mb_stride] >> (block_num * 4)) & 0xF;
    if (ttblk == TT_4X4 || ttblk == TT_8X4) {
        idx = (block_cbp | (block_cbp >> 2)) & 3;
        if (idx == 3) {
            v->vc1dsp.vc1_v_loop_filter8(dst, linesize, v->pq);
        } else if (idx) {
            if (idx == 1)
                v->vc1dsp.vc1_v_loop_filter4(dst + 4, linesize, v->pq);
            else
                v->vc1dsp.vc1_v_loop_filter4(dst,     linesize, v->pq);
        }
    }
}

static av_always_inline void vc1_apply_p_h_loop_filter(VC1Context *v, int block_num)
{
    MpegEncContext *s  = &v->s;
    int mb_cbp         = v->cbp[s->mb_x - 1 - s->mb_stride],
        block_cbp      = mb_cbp      >> (block_num * 4), right_cbp,
        mb_is_intra    = v->is_intra[s->mb_x - 1 - s->mb_stride],
        block_is_intra = mb_is_intra >> block_num, right_is_intra;
    int idx, linesize  = block_num > 3 ? s->uvlinesize : s->linesize, ttblk;
    uint8_t *dst;

    if (block_num > 3) {
        dst = s->dest[block_num - 3] - 8 * linesize;
    } else {
        dst = s->dest[0] + (block_num & 1) * 8 + ((block_num & 2) * 4 - 16) * linesize - 8;
    }

    if (s->mb_x != s->mb_width || !(block_num & 5)) {
        int16_t (*mv)[2];

        if (block_num > 3) {
            right_cbp      = v->cbp[s->mb_x - s->mb_stride] >> (block_num * 4);
            right_is_intra = v->is_intra[s->mb_x - s->mb_stride] >> block_num;
            mv             = &v->luma_mv[s->mb_x - s->mb_stride - 1];
        } else {
            right_cbp      = (block_num & 1) ? (v->cbp[s->mb_x - s->mb_stride]      >> ((block_num - 1) * 4))
                                             : (mb_cbp                              >> ((block_num + 1) * 4));
            right_is_intra = (block_num & 1) ? (v->is_intra[s->mb_x - s->mb_stride] >> (block_num - 1))
                                             : (mb_is_intra                         >> (block_num + 1));
            mv             = &s->current_picture.motion_val[0][s->block_index[block_num] - s->b8_stride * 2 - 2];
        }
        if (block_is_intra & 1 || right_is_intra & 1 || mv[0][0] != mv[1][0] || mv[0][1] != mv[1][1]) {
            v->vc1dsp.vc1_h_loop_filter8(dst, linesize, v->pq);
        } else {
            idx = ((right_cbp >> 1) | block_cbp) & 5; // FIXME check
            if (idx == 5) {
                v->vc1dsp.vc1_h_loop_filter8(dst, linesize, v->pq);
            } else if (idx) {
                if (idx == 1)
                    v->vc1dsp.vc1_h_loop_filter4(dst + 4 * linesize, linesize, v->pq);
                else
                    v->vc1dsp.vc1_h_loop_filter4(dst,                linesize, v->pq);
            }
        }
    }

    dst -= 4;
    ttblk = (v->ttblk[s->mb_x - s->mb_stride - 1] >> (block_num * 4)) & 0xf;
    if (ttblk == TT_4X4 || ttblk == TT_4X8) {
        idx = (block_cbp | (block_cbp >> 1)) & 5;
        if (idx == 5) {
            v->vc1dsp.vc1_h_loop_filter8(dst, linesize, v->pq);
        } else if (idx) {
            if (idx == 1)
                v->vc1dsp.vc1_h_loop_filter4(dst + linesize * 4, linesize, v->pq);
            else
                v->vc1dsp.vc1_h_loop_filter4(dst,                linesize, v->pq);
        }
    }
}

void ff_vc1_apply_p_loop_filter(VC1Context *v)
{
    MpegEncContext *s = &v->s;
    int i;

    for (i = 0; i < 6; i++) {
        vc1_apply_p_v_loop_filter(v, i);
    }

    /* V always precedes H, therefore we run H one MB before V;
     * at the end of a row, we catch up to complete the row */
    if (s->mb_x) {
        for (i = 0; i < 6; i++) {
            vc1_apply_p_h_loop_filter(v, i);
        }
        if (s->mb_x == s->mb_width - 1) {
            s->mb_x++;
            ff_update_block_index(s);
            for (i = 0; i < 6; i++) {
                vc1_apply_p_h_loop_filter(v, i);
            }
        }
    }
}
Commit	Line	Data
	1	/*
	2	* VC-1 and WMV3 decoder
	3	* Copyright (c) 2011 Mashiat Sarker Shakkhar
	4	* Copyright (c) 2006-2007 Konstantin Shishkov
	5	* Partly based on vc9.c (c) 2005 Anonymous, Alex Beregszaszi, Michael Niedermayer
	6	*
	7	* This file is part of FFmpeg.
	8	*
	9	* FFmpeg is free software; you can redistribute it and/or
	10	* modify it under the terms of the GNU Lesser General Public
	11	* License as published by the Free Software Foundation; either
	12	* version 2.1 of the License, or (at your option) any later version.
	13	*
	14	* FFmpeg is distributed in the hope that it will be useful,
	15	* but WITHOUT ANY WARRANTY; without even the implied warranty of
	16	* MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
	17	* Lesser General Public License for more details.
	18	*
	19	* You should have received a copy of the GNU Lesser General Public
	20	* License along with FFmpeg; if not, write to the Free Software
	21	* Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
	22	*/
	23
	24	/**
	25	* @file
	26	* VC-1 and WMV3 loopfilter
	27	*/
	28
	29	#include "avcodec.h"
	30	#include "mpegvideo.h"
	31	#include "vc1.h"
	32	#include "vc1dsp.h"
	33
	34	void ff_vc1_loop_filter_iblk(VC1Context *v, int pq)
	35	{
	36	MpegEncContext *s = &v->s;
	37	int j;
	38	if (!s->first_slice_line) {
	39	v->vc1dsp.vc1_v_loop_filter16(s->dest[0], s->linesize, pq);
	40	if (s->mb_x)
	41	v->vc1dsp.vc1_h_loop_filter16(s->dest[0] - 16 * s->linesize, s->linesize, pq);
	42	v->vc1dsp.vc1_h_loop_filter16(s->dest[0] - 16 * s->linesize + 8, s->linesize, pq);
	43	for (j = 0; j < 2; j++) {
	44	v->vc1dsp.vc1_v_loop_filter8(s->dest[j + 1], s->uvlinesize, pq);
	45	if (s->mb_x)
	46	v->vc1dsp.vc1_h_loop_filter8(s->dest[j + 1] - 8 * s->uvlinesize, s->uvlinesize, pq);
	47	}
	48	}
	49	v->vc1dsp.vc1_v_loop_filter16(s->dest[0] + 8 * s->linesize, s->linesize, pq);
	50
	51	if (s->mb_y == s->end_mb_y - 1) {
	52	if (s->mb_x) {
	53	v->vc1dsp.vc1_h_loop_filter16(s->dest[0], s->linesize, pq);
	54	v->vc1dsp.vc1_h_loop_filter8(s->dest[1], s->uvlinesize, pq);
	55	v->vc1dsp.vc1_h_loop_filter8(s->dest[2], s->uvlinesize, pq);
	56	}
	57	v->vc1dsp.vc1_h_loop_filter16(s->dest[0] + 8, s->linesize, pq);
	58	}
	59	}
	60
	61	void ff_vc1_loop_filter_iblk_delayed(VC1Context *v, int pq)
	62	{
	63	MpegEncContext *s = &v->s;
	64	int j;
	65
	66	/* The loopfilter runs 1 row and 1 column behind the overlap filter, which
	67	* means it runs two rows/cols behind the decoding loop. */
	68	if (!s->first_slice_line) {
	69	if (s->mb_x) {
	70	if (s->mb_y >= s->start_mb_y + 2) {
	71	v->vc1dsp.vc1_v_loop_filter16(s->dest[0] - 16 * s->linesize - 16, s->linesize, pq);
	72
	73	if (s->mb_x >= 2)
	74	v->vc1dsp.vc1_h_loop_filter16(s->dest[0] - 32 * s->linesize - 16, s->linesize, pq);
	75	v->vc1dsp.vc1_h_loop_filter16(s->dest[0] - 32 * s->linesize - 8, s->linesize, pq);
	76	for (j = 0; j < 2; j++) {
	77	v->vc1dsp.vc1_v_loop_filter8(s->dest[j + 1] - 8 * s->uvlinesize - 8, s->uvlinesize, pq);
	78	if (s->mb_x >= 2) {
	79	v->vc1dsp.vc1_h_loop_filter8(s->dest[j + 1] - 16 * s->uvlinesize - 8, s->uvlinesize, pq);
	80	}
	81	}
	82	}
	83	v->vc1dsp.vc1_v_loop_filter16(s->dest[0] - 8 * s->linesize - 16, s->linesize, pq);
	84	}
	85
	86	if (s->mb_x == s->mb_width - 1) {
	87	if (s->mb_y >= s->start_mb_y + 2) {
	88	v->vc1dsp.vc1_v_loop_filter16(s->dest[0] - 16 * s->linesize, s->linesize, pq);
	89
	90	if (s->mb_x)
	91	v->vc1dsp.vc1_h_loop_filter16(s->dest[0] - 32 * s->linesize, s->linesize, pq);
	92	v->vc1dsp.vc1_h_loop_filter16(s->dest[0] - 32 * s->linesize + 8, s->linesize, pq);
	93	for (j = 0; j < 2; j++) {
	94	v->vc1dsp.vc1_v_loop_filter8(s->dest[j + 1] - 8 * s->uvlinesize, s->uvlinesize, pq);
	95	if (s->mb_x >= 2) {
	96	v->vc1dsp.vc1_h_loop_filter8(s->dest[j + 1] - 16 * s->uvlinesize, s->uvlinesize, pq);
	97	}
	98	}
	99	}
	100	v->vc1dsp.vc1_v_loop_filter16(s->dest[0] - 8 * s->linesize, s->linesize, pq);
	101	}
	102
	103	if (s->mb_y == s->end_mb_y) {
	104	if (s->mb_x) {
	105	if (s->mb_x >= 2)
	106	v->vc1dsp.vc1_h_loop_filter16(s->dest[0] - 16 * s->linesize - 16, s->linesize, pq);
	107	v->vc1dsp.vc1_h_loop_filter16(s->dest[0] - 16 * s->linesize - 8, s->linesize, pq);
	108	if (s->mb_x >= 2) {
	109	for (j = 0; j < 2; j++) {
	110	v->vc1dsp.vc1_h_loop_filter8(s->dest[j + 1] - 8 * s->uvlinesize - 8, s->uvlinesize, pq);
	111	}
	112	}
	113	}
	114
	115	if (s->mb_x == s->mb_width - 1) {
	116	if (s->mb_x)
	117	v->vc1dsp.vc1_h_loop_filter16(s->dest[0] - 16 * s->linesize, s->linesize, pq);
	118	v->vc1dsp.vc1_h_loop_filter16(s->dest[0] - 16 * s->linesize + 8, s->linesize, pq);
	119	if (s->mb_x) {
	120	for (j = 0; j < 2; j++) {
	121	v->vc1dsp.vc1_h_loop_filter8(s->dest[j + 1] - 8 * s->uvlinesize, s->uvlinesize, pq);
	122	}
	123	}
	124	}
	125	}
	126	}
	127	}
	128
	129	void ff_vc1_smooth_overlap_filter_iblk(VC1Context *v)
	130	{
	131	MpegEncContext *s = &v->s;
	132	int mb_pos;
	133
	134	if (v->condover == CONDOVER_NONE)
	135	return;
	136
	137	mb_pos = s->mb_x + s->mb_y * s->mb_stride;
	138
	139	/* Within a MB, the horizontal overlap always runs before the vertical.
	140	* To accomplish that, we run the H on left and internal borders of the
	141	* currently decoded MB. Then, we wait for the next overlap iteration
	142	* to do H overlap on the right edge of this MB, before moving over and
	143	* running the V overlap. Therefore, the V overlap makes us trail by one
	144	* MB col and the H overlap filter makes us trail by one MB row. This
	145	* is reflected in the time at which we run the put_pixels loop. */
	146	if (v->condover == CONDOVER_ALL \|\| v->pq >= 9 \|\| v->over_flags_plane[mb_pos]) {
	147	if (s->mb_x && (v->condover == CONDOVER_ALL \|\| v->pq >= 9 \|\|
	148	v->over_flags_plane[mb_pos - 1])) {
	149	v->vc1dsp.vc1_h_s_overlap(v->block[v->left_blk_idx][1],
	150	v->block[v->cur_blk_idx][0]);
	151	v->vc1dsp.vc1_h_s_overlap(v->block[v->left_blk_idx][3],
	152	v->block[v->cur_blk_idx][2]);
	153	if (!(s->flags & CODEC_FLAG_GRAY)) {
	154	v->vc1dsp.vc1_h_s_overlap(v->block[v->left_blk_idx][4],
	155	v->block[v->cur_blk_idx][4]);
	156	v->vc1dsp.vc1_h_s_overlap(v->block[v->left_blk_idx][5],
	157	v->block[v->cur_blk_idx][5]);
	158	}
	159	}
	160	v->vc1dsp.vc1_h_s_overlap(v->block[v->cur_blk_idx][0],
	161	v->block[v->cur_blk_idx][1]);
	162	v->vc1dsp.vc1_h_s_overlap(v->block[v->cur_blk_idx][2],
	163	v->block[v->cur_blk_idx][3]);
	164
	165	if (s->mb_x == s->mb_width - 1) {
	166	if (!s->first_slice_line && (v->condover == CONDOVER_ALL \|\| v->pq >= 9 \|\|
	167	v->over_flags_plane[mb_pos - s->mb_stride])) {
	168	v->vc1dsp.vc1_v_s_overlap(v->block[v->top_blk_idx][2],
	169	v->block[v->cur_blk_idx][0]);
	170	v->vc1dsp.vc1_v_s_overlap(v->block[v->top_blk_idx][3],
	171	v->block[v->cur_blk_idx][1]);
	172	if (!(s->flags & CODEC_FLAG_GRAY)) {
	173	v->vc1dsp.vc1_v_s_overlap(v->block[v->top_blk_idx][4],
	174	v->block[v->cur_blk_idx][4]);
	175	v->vc1dsp.vc1_v_s_overlap(v->block[v->top_blk_idx][5],
	176	v->block[v->cur_blk_idx][5]);
	177	}
	178	}
	179	v->vc1dsp.vc1_v_s_overlap(v->block[v->cur_blk_idx][0],
	180	v->block[v->cur_blk_idx][2]);
	181	v->vc1dsp.vc1_v_s_overlap(v->block[v->cur_blk_idx][1],
	182	v->block[v->cur_blk_idx][3]);
	183	}
	184	}
	185	if (s->mb_x && (v->condover == CONDOVER_ALL \|\| v->over_flags_plane[mb_pos - 1])) {
	186	if (!s->first_slice_line && (v->condover == CONDOVER_ALL \|\| v->pq >= 9 \|\|
	187	v->over_flags_plane[mb_pos - s->mb_stride - 1])) {
	188	v->vc1dsp.vc1_v_s_overlap(v->block[v->topleft_blk_idx][2],
	189	v->block[v->left_blk_idx][0]);
	190	v->vc1dsp.vc1_v_s_overlap(v->block[v->topleft_blk_idx][3],
	191	v->block[v->left_blk_idx][1]);
	192	if (!(s->flags & CODEC_FLAG_GRAY)) {
	193	v->vc1dsp.vc1_v_s_overlap(v->block[v->topleft_blk_idx][4],
	194	v->block[v->left_blk_idx][4]);
	195	v->vc1dsp.vc1_v_s_overlap(v->block[v->topleft_blk_idx][5],
	196	v->block[v->left_blk_idx][5]);
	197	}
	198	}
	199	v->vc1dsp.vc1_v_s_overlap(v->block[v->left_blk_idx][0],
	200	v->block[v->left_blk_idx][2]);
	201	v->vc1dsp.vc1_v_s_overlap(v->block[v->left_blk_idx][1],
	202	v->block[v->left_blk_idx][3]);
	203	}
	204	}
	205
	206	static av_always_inline void vc1_apply_p_v_loop_filter(VC1Context *v, int block_num)
	207	{
	208	MpegEncContext *s = &v->s;
	209	int mb_cbp = v->cbp[s->mb_x - s->mb_stride],
	210	block_cbp = mb_cbp >> (block_num * 4), bottom_cbp,
	211	mb_is_intra = v->is_intra[s->mb_x - s->mb_stride],
	212	block_is_intra = mb_is_intra >> block_num, bottom_is_intra;
	213	int idx, linesize = block_num > 3 ? s->uvlinesize : s->linesize, ttblk;
	214	uint8_t *dst;
	215
	216	if (block_num > 3) {
	217	dst = s->dest[block_num - 3];
	218	} else {
	219	dst = s->dest[0] + (block_num & 1) * 8 + ((block_num & 2) * 4 - 8) * linesize;
	220	}
	221	if (s->mb_y != s->end_mb_y \|\| block_num < 2) {
	222	int16_t (*mv)[2];
	223	int mv_stride;
	224
	225	if (block_num > 3) {
	226	bottom_cbp = v->cbp[s->mb_x] >> (block_num * 4);
	227	bottom_is_intra = v->is_intra[s->mb_x] >> block_num;
	228	mv = &v->luma_mv[s->mb_x - s->mb_stride];
	229	mv_stride = s->mb_stride;
	230	} else {
	231	bottom_cbp = (block_num < 2) ? (mb_cbp >> ((block_num + 2) * 4))
	232	: (v->cbp[s->mb_x] >> ((block_num - 2) * 4));
	233	bottom_is_intra = (block_num < 2) ? (mb_is_intra >> (block_num + 2))
	234	: (v->is_intra[s->mb_x] >> (block_num - 2));
	235	mv_stride = s->b8_stride;
	236	mv = &s->current_picture.motion_val[0][s->block_index[block_num] - 2 * mv_stride];
	237	}
	238
	239	if (bottom_is_intra & 1 \|\| block_is_intra & 1 \|\|
	240	mv[0][0] != mv[mv_stride][0] \|\| mv[0][1] != mv[mv_stride][1]) {
	241	v->vc1dsp.vc1_v_loop_filter8(dst, linesize, v->pq);
	242	} else {
	243	idx = ((bottom_cbp >> 2) \| block_cbp) & 3;
	244	if (idx == 3) {
	245	v->vc1dsp.vc1_v_loop_filter8(dst, linesize, v->pq);
	246	} else if (idx) {
	247	if (idx == 1)
	248	v->vc1dsp.vc1_v_loop_filter4(dst + 4, linesize, v->pq);
	249	else
	250	v->vc1dsp.vc1_v_loop_filter4(dst, linesize, v->pq);
	251	}
	252	}
	253	}
	254
	255	dst -= 4 * linesize;
	256	ttblk = (v->ttblk[s->mb_x - s->mb_stride] >> (block_num * 4)) & 0xF;
	257	if (ttblk == TT_4X4 \|\| ttblk == TT_8X4) {
	258	idx = (block_cbp \| (block_cbp >> 2)) & 3;
	259	if (idx == 3) {
	260	v->vc1dsp.vc1_v_loop_filter8(dst, linesize, v->pq);
	261	} else if (idx) {
	262	if (idx == 1)
	263	v->vc1dsp.vc1_v_loop_filter4(dst + 4, linesize, v->pq);
	264	else
	265	v->vc1dsp.vc1_v_loop_filter4(dst, linesize, v->pq);
	266	}
	267	}
	268	}
	269
	270	static av_always_inline void vc1_apply_p_h_loop_filter(VC1Context *v, int block_num)
	271	{
	272	MpegEncContext *s = &v->s;
	273	int mb_cbp = v->cbp[s->mb_x - 1 - s->mb_stride],
	274	block_cbp = mb_cbp >> (block_num * 4), right_cbp,
	275	mb_is_intra = v->is_intra[s->mb_x - 1 - s->mb_stride],
	276	block_is_intra = mb_is_intra >> block_num, right_is_intra;
	277	int idx, linesize = block_num > 3 ? s->uvlinesize : s->linesize, ttblk;
	278	uint8_t *dst;
	279
	280	if (block_num > 3) {
	281	dst = s->dest[block_num - 3] - 8 * linesize;
	282	} else {
	283	dst = s->dest[0] + (block_num & 1) * 8 + ((block_num & 2) * 4 - 16) * linesize - 8;
	284	}
	285
	286	if (s->mb_x != s->mb_width \|\| !(block_num & 5)) {
	287	int16_t (*mv)[2];
	288
	289	if (block_num > 3) {
	290	right_cbp = v->cbp[s->mb_x - s->mb_stride] >> (block_num * 4);
	291	right_is_intra = v->is_intra[s->mb_x - s->mb_stride] >> block_num;
	292	mv = &v->luma_mv[s->mb_x - s->mb_stride - 1];
	293	} else {
	294	right_cbp = (block_num & 1) ? (v->cbp[s->mb_x - s->mb_stride] >> ((block_num - 1) * 4))
	295	: (mb_cbp >> ((block_num + 1) * 4));
	296	right_is_intra = (block_num & 1) ? (v->is_intra[s->mb_x - s->mb_stride] >> (block_num - 1))
	297	: (mb_is_intra >> (block_num + 1));
	298	mv = &s->current_picture.motion_val[0][s->block_index[block_num] - s->b8_stride * 2 - 2];
	299	}
	300	if (block_is_intra & 1 \|\| right_is_intra & 1 \|\| mv[0][0] != mv[1][0] \|\| mv[0][1] != mv[1][1]) {
	301	v->vc1dsp.vc1_h_loop_filter8(dst, linesize, v->pq);
	302	} else {
	303	idx = ((right_cbp >> 1) \| block_cbp) & 5; // FIXME check
	304	if (idx == 5) {
	305	v->vc1dsp.vc1_h_loop_filter8(dst, linesize, v->pq);
	306	} else if (idx) {
	307	if (idx == 1)
	308	v->vc1dsp.vc1_h_loop_filter4(dst + 4 * linesize, linesize, v->pq);
	309	else
	310	v->vc1dsp.vc1_h_loop_filter4(dst, linesize, v->pq);
	311	}
	312	}
	313	}
	314
	315	dst -= 4;
	316	ttblk = (v->ttblk[s->mb_x - s->mb_stride - 1] >> (block_num * 4)) & 0xf;
	317	if (ttblk == TT_4X4 \|\| ttblk == TT_4X8) {
	318	idx = (block_cbp \| (block_cbp >> 1)) & 5;
	319	if (idx == 5) {
	320	v->vc1dsp.vc1_h_loop_filter8(dst, linesize, v->pq);
	321	} else if (idx) {
	322	if (idx == 1)
	323	v->vc1dsp.vc1_h_loop_filter4(dst + linesize * 4, linesize, v->pq);
	324	else
	325	v->vc1dsp.vc1_h_loop_filter4(dst, linesize, v->pq);
	326	}
	327	}
	328	}
	329
	330	void ff_vc1_apply_p_loop_filter(VC1Context *v)
	331	{
	332	MpegEncContext *s = &v->s;
	333	int i;
	334
	335	for (i = 0; i < 6; i++) {
	336	vc1_apply_p_v_loop_filter(v, i);
	337	}
	338
	339	/* V always precedes H, therefore we run H one MB before V;
	340	* at the end of a row, we catch up to complete the row */
	341	if (s->mb_x) {
	342	for (i = 0; i < 6; i++) {
	343	vc1_apply_p_h_loop_filter(v, i);
	344	}
	345	if (s->mb_x == s->mb_width - 1) {
	346	s->mb_x++;
	347	ff_update_block_index(s);
	348	for (i = 0; i < 6; i++) {
	349	vc1_apply_p_h_loop_filter(v, i);
	350	}
	351	}
	352	}
	353	}