linux-stable-rt/arch/mips/lib-64/csum_partial.S

/*
 * This file is subject to the terms and conditions of the GNU General Public
 * License.  See the file "COPYING" in the main directory of this archive
 * for more details.
 *
 * Quick'n'dirty IP checksum ...
 *
 * Copyright (C) 1998, 1999 Ralf Baechle
 * Copyright (C) 1999 Silicon Graphics, Inc.
 */
#include <asm/asm.h>
#include <asm/regdef.h>

#define ADDC(sum,reg)						\
	addu	sum, reg;					\
	sltu	v1, sum, reg;					\
	addu	sum, v1

#define CSUM_BIGCHUNK(src, offset, sum, t0, t1, t2, t3)		\
	lw	t0, (offset + 0x00)(src);			\
	lw	t1, (offset + 0x04)(src);			\
	lw	t2, (offset + 0x08)(src); 			\
	lw	t3, (offset + 0x0c)(src); 			\
	ADDC(sum, t0);						\
	ADDC(sum, t1);						\
	ADDC(sum, t2);						\
	ADDC(sum, t3);						\
	lw	t0, (offset + 0x10)(src);			\
	lw	t1, (offset + 0x14)(src);			\
	lw	t2, (offset + 0x18)(src);			\
	lw	t3, (offset + 0x1c)(src);			\
	ADDC(sum, t0);						\
	ADDC(sum, t1);						\
	ADDC(sum, t2);						\
	ADDC(sum, t3);						\

/*
 * a0: source address
 * a1: length of the area to checksum
 * a2: partial checksum
 */

#define src a0
#define sum v0

	.text
	.set	noreorder

/* unknown src alignment and < 8 bytes to go  */
small_csumcpy:
	move	a1, ta2

	andi	ta0, a1, 4
	beqz	ta0, 1f
	 andi	ta0, a1, 2

	/* Still a full word to go  */
	ulw	ta1, (src)
	daddiu	src, 4
	ADDC(sum, ta1)

1:	move	ta1, zero
	beqz	ta0, 1f
	 andi	ta0, a1, 1

	/* Still a halfword to go  */
	ulhu	ta1, (src)
	daddiu	src, 2

1:	beqz	ta0, 1f
	 sll	ta1, ta1, 16

	lbu	ta2, (src)
	 nop

#ifdef __MIPSEB__
	sll	ta2, ta2, 8
#endif
	or	ta1, ta2

1:	ADDC(sum, ta1)

	/* fold checksum */
	sll	v1, sum, 16
	addu	sum, v1
	sltu	v1, sum, v1
	srl	sum, sum, 16
	addu	sum, v1

	/* odd buffer alignment? */
	beqz	t3, 1f
	 nop
	sll	v1, sum, 8
	srl	sum, sum, 8
	or	sum, v1
	andi	sum, 0xffff
1:
	.set	reorder
	/* Add the passed partial csum.  */
	ADDC(sum, a2)
	jr	ra
	.set	noreorder

/* ------------------------------------------------------------------------- */

	.align	5
LEAF(csum_partial)
	move	sum, zero
	move	t3, zero

	sltiu	t8, a1, 0x8
	bnez	t8, small_csumcpy		/* < 8 bytes to copy */
	 move	ta2, a1

	beqz	a1, out
	 andi	t3, src, 0x1			/* odd buffer? */

hword_align:
	beqz	t3, word_align
	 andi	t8, src, 0x2

	lbu	ta0, (src)
	dsubu	a1, a1, 0x1
#ifdef __MIPSEL__
	sll	ta0, ta0, 8
#endif
	ADDC(sum, ta0)
	daddu	src, src, 0x1
	andi	t8, src, 0x2

word_align:
	beqz	t8, dword_align
	 sltiu	t8, a1, 56

	lhu	ta0, (src)
	dsubu	a1, a1, 0x2
	ADDC(sum, ta0)
	sltiu	t8, a1, 56
	daddu	src, src, 0x2

dword_align:
	bnez	t8, do_end_words
	 move	t8, a1

	andi	t8, src, 0x4
	beqz	t8, qword_align
	 andi	t8, src, 0x8

	lw	ta0, 0x00(src)
	dsubu	a1, a1, 0x4
	ADDC(sum, ta0)
	daddu	src, src, 0x4
	andi	t8, src, 0x8

qword_align:
	beqz	t8, oword_align
	 andi	t8, src, 0x10

	lw	ta0, 0x00(src)
	lw	ta1, 0x04(src)
	dsubu	a1, a1, 0x8
	ADDC(sum, ta0)
	ADDC(sum, ta1)
	daddu	src, src, 0x8
	andi	t8, src, 0x10

oword_align:
	beqz	t8, begin_movement
	 dsrl	t8, a1, 0x7

	lw	ta3, 0x08(src)
	lw	t0, 0x0c(src)
	lw	ta0, 0x00(src)
	lw	ta1, 0x04(src)
	ADDC(sum, ta3)
	ADDC(sum, t0)
	ADDC(sum, ta0)
	ADDC(sum, ta1)
	dsubu	a1, a1, 0x10
	daddu	src, src, 0x10
	dsrl	t8, a1, 0x7

begin_movement:
	beqz	t8, 1f
	 andi	ta2, a1, 0x40

move_128bytes:
	CSUM_BIGCHUNK(src, 0x00, sum, ta0, ta1, ta3, t0)
	CSUM_BIGCHUNK(src, 0x20, sum, ta0, ta1, ta3, t0)
	CSUM_BIGCHUNK(src, 0x40, sum, ta0, ta1, ta3, t0)
	CSUM_BIGCHUNK(src, 0x60, sum, ta0, ta1, ta3, t0)
	dsubu	t8, t8, 0x01
	bnez	t8, move_128bytes
	 daddu	src, src, 0x80

1:
	beqz	ta2, 1f
	 andi	ta2, a1, 0x20

move_64bytes:
	CSUM_BIGCHUNK(src, 0x00, sum, ta0, ta1, ta3, t0)
	CSUM_BIGCHUNK(src, 0x20, sum, ta0, ta1, ta3, t0)
	daddu	src, src, 0x40

1:
	beqz	ta2, do_end_words
	 andi	t8, a1, 0x1c

move_32bytes:
	CSUM_BIGCHUNK(src, 0x00, sum, ta0, ta1, ta3, t0)
	andi	t8, a1, 0x1c
	daddu	src, src, 0x20

do_end_words:
	beqz	t8, maybe_end_cruft
	 dsrl	t8, t8, 0x2

end_words:
	lw	ta0, (src)
	dsubu	t8, t8, 0x1
	ADDC(sum, ta0)
	bnez	t8, end_words
	 daddu	src, src, 0x4

maybe_end_cruft:
	andi	ta2, a1, 0x3

small_memcpy:
 j small_csumcpy; move a1, ta2		/* XXX ??? */
	beqz	t2, out
	 move	a1, ta2

end_bytes:
	lb	ta0, (src)
	dsubu	a1, a1, 0x1
	bnez	a2, end_bytes
	 daddu	src, src, 0x1

out:
	jr	ra
	 move	v0, sum
	END(csum_partial)
Linux-2.6.12-rc2 Initial git repository build. I'm not bothering with the full history, even though we have it. We can create a separate "historical" git archive of that later if we want to, and in the meantime it's about 3.2GB when imported into git - space that would just make the early git days unnecessarily complicated, when we don't have a lot of good infrastructure for it. Let it rip! 2005-04-17 06:20:36 +08:00			`/*`
			`* This file is subject to the terms and conditions of the GNU General Public`
			`* License. See the file "COPYING" in the main directory of this archive`
			`* for more details.`
			`*`
			`* Quick'n'dirty IP checksum ...`
			`*`
			`* Copyright (C) 1998, 1999 Ralf Baechle`
			`* Copyright (C) 1999 Silicon Graphics, Inc.`
			`*/`
			`#include <asm/asm.h>`
			`#include <asm/regdef.h>`

			`#define ADDC(sum,reg) \`
			`addu sum, reg; \`
			`sltu v1, sum, reg; \`
			`addu sum, v1`

			`#define CSUM_BIGCHUNK(src, offset, sum, t0, t1, t2, t3) \`
			`lw t0, (offset + 0x00)(src); \`
			`lw t1, (offset + 0x04)(src); \`
			`lw t2, (offset + 0x08)(src); \`
			`lw t3, (offset + 0x0c)(src); \`
			`ADDC(sum, t0); \`
			`ADDC(sum, t1); \`
			`ADDC(sum, t2); \`
			`ADDC(sum, t3); \`
			`lw t0, (offset + 0x10)(src); \`
			`lw t1, (offset + 0x14)(src); \`
			`lw t2, (offset + 0x18)(src); \`
			`lw t3, (offset + 0x1c)(src); \`
			`ADDC(sum, t0); \`
			`ADDC(sum, t1); \`
			`ADDC(sum, t2); \`
			`ADDC(sum, t3); \`

			`/*`
			`* a0: source address`
			`* a1: length of the area to checksum`
			`* a2: partial checksum`
			`*/`

			`#define src a0`
			`#define sum v0`

			`.text`
			`.set noreorder`

			`/* unknown src alignment and < 8 bytes to go */`
			`small_csumcpy:`
			`move a1, ta2`

			`andi ta0, a1, 4`
			`beqz ta0, 1f`
			`andi ta0, a1, 2`

			`/* Still a full word to go */`
			`ulw ta1, (src)`
			`daddiu src, 4`
			`ADDC(sum, ta1)`

			`1: move ta1, zero`
			`beqz ta0, 1f`
			`andi ta0, a1, 1`

			`/* Still a halfword to go */`
			`ulhu ta1, (src)`
			`daddiu src, 2`

			`1: beqz ta0, 1f`
			`sll ta1, ta1, 16`

			`lbu ta2, (src)`
			`nop`

			`#ifdef __MIPSEB__`
			`sll ta2, ta2, 8`
			`#endif`
			`or ta1, ta2`

			`1: ADDC(sum, ta1)`

			`/* fold checksum */`
			`sll v1, sum, 16`
			`addu sum, v1`
			`sltu v1, sum, v1`
			`srl sum, sum, 16`
			`addu sum, v1`

			`/* odd buffer alignment? */`
			`beqz t3, 1f`
			`nop`
			`sll v1, sum, 8`
			`srl sum, sum, 8`
			`or sum, v1`
			`andi sum, 0xffff`
			`1:`
			`.set reorder`
			`/* Add the passed partial csum. */`
			`ADDC(sum, a2)`
			`jr ra`
			`.set noreorder`

			`/* ------------------------------------------------------------------------- */`

			`.align 5`
			`LEAF(csum_partial)`
			`move sum, zero`
			`move t3, zero`

			`sltiu t8, a1, 0x8`
			`bnez t8, small_csumcpy /* < 8 bytes to copy */`
			`move ta2, a1`

			`beqz a1, out`
			`andi t3, src, 0x1 /* odd buffer? */`

			`hword_align:`
			`beqz t3, word_align`
			`andi t8, src, 0x2`

			`lbu ta0, (src)`
			`dsubu a1, a1, 0x1`
			`#ifdef __MIPSEL__`
			`sll ta0, ta0, 8`
			`#endif`
			`ADDC(sum, ta0)`
			`daddu src, src, 0x1`
			`andi t8, src, 0x2`

			`word_align:`
			`beqz t8, dword_align`
			`sltiu t8, a1, 56`

			`lhu ta0, (src)`
			`dsubu a1, a1, 0x2`
			`ADDC(sum, ta0)`
			`sltiu t8, a1, 56`
			`daddu src, src, 0x2`

			`dword_align:`
			`bnez t8, do_end_words`
			`move t8, a1`

			`andi t8, src, 0x4`
			`beqz t8, qword_align`
			`andi t8, src, 0x8`

			`lw ta0, 0x00(src)`
			`dsubu a1, a1, 0x4`
			`ADDC(sum, ta0)`
			`daddu src, src, 0x4`
			`andi t8, src, 0x8`

			`qword_align:`
			`beqz t8, oword_align`
			`andi t8, src, 0x10`

			`lw ta0, 0x00(src)`
			`lw ta1, 0x04(src)`
			`dsubu a1, a1, 0x8`
			`ADDC(sum, ta0)`
			`ADDC(sum, ta1)`
			`daddu src, src, 0x8`
			`andi t8, src, 0x10`

			`oword_align:`
			`beqz t8, begin_movement`
			`dsrl t8, a1, 0x7`

			`lw ta3, 0x08(src)`
			`lw t0, 0x0c(src)`
			`lw ta0, 0x00(src)`
			`lw ta1, 0x04(src)`
			`ADDC(sum, ta3)`
			`ADDC(sum, t0)`
			`ADDC(sum, ta0)`
			`ADDC(sum, ta1)`
			`dsubu a1, a1, 0x10`
			`daddu src, src, 0x10`
			`dsrl t8, a1, 0x7`

			`begin_movement:`
			`beqz t8, 1f`
			`andi ta2, a1, 0x40`

			`move_128bytes:`
			`CSUM_BIGCHUNK(src, 0x00, sum, ta0, ta1, ta3, t0)`
			`CSUM_BIGCHUNK(src, 0x20, sum, ta0, ta1, ta3, t0)`
			`CSUM_BIGCHUNK(src, 0x40, sum, ta0, ta1, ta3, t0)`
			`CSUM_BIGCHUNK(src, 0x60, sum, ta0, ta1, ta3, t0)`
			`dsubu t8, t8, 0x01`
			`bnez t8, move_128bytes`
			`daddu src, src, 0x80`

			`1:`
			`beqz ta2, 1f`
			`andi ta2, a1, 0x20`

			`move_64bytes:`
			`CSUM_BIGCHUNK(src, 0x00, sum, ta0, ta1, ta3, t0)`
			`CSUM_BIGCHUNK(src, 0x20, sum, ta0, ta1, ta3, t0)`
			`daddu src, src, 0x40`

			`1:`
			`beqz ta2, do_end_words`
			`andi t8, a1, 0x1c`

			`move_32bytes:`
			`CSUM_BIGCHUNK(src, 0x00, sum, ta0, ta1, ta3, t0)`
			`andi t8, a1, 0x1c`
			`daddu src, src, 0x20`

			`do_end_words:`
			`beqz t8, maybe_end_cruft`
			`dsrl t8, t8, 0x2`

			`end_words:`
			`lw ta0, (src)`
			`dsubu t8, t8, 0x1`
			`ADDC(sum, ta0)`
			`bnez t8, end_words`
			`daddu src, src, 0x4`

			`maybe_end_cruft:`
			`andi ta2, a1, 0x3`

			`small_memcpy:`
			`j small_csumcpy; move a1, ta2 /* XXX ??? */`
			`beqz t2, out`
			`move a1, ta2`

			`end_bytes:`
			`lb ta0, (src)`
			`dsubu a1, a1, 0x1`
			`bnez a2, end_bytes`
			`daddu src, src, 0x1`

			`out:`
			`jr ra`
			`move v0, sum`
			`END(csum_partial)`