src/pkg/big/arith_386.s - go - Git at Google

 // Copyright 2009 The Go Authors. All rights reserved.
 // Use of this source code is governed by a BSD-style
 // license that can be found in the LICENSE file.

 // This file provides fast assembly versions for the elementary
 // arithmetic operations on vectors implemented in arith.go.

 // func addVV_s(z, x, y *Word, n int) (c Word)
 TEXT ·addVV_s(SB),7,$0
 	MOVL z+0(FP), DI
 	MOVL x+4(FP), SI
 	MOVL y+8(FP), CX
 	MOVL n+12(FP), BP
 	MOVL $0, BX         // i = 0
 	MOVL $0, DX         // c = 0
 	JMP E1

 L1:	MOVL (SI)(BX*4), AX
 	RCRL $1, DX
 	ADCL (CX)(BX*4), AX
 	RCLL $1, DX
 	MOVL AX, (DI)(BX*4)
 	ADDL $1, BX			// i++

 E1:	CMPL BX, BP		// i < n
 	JL L1

 	MOVL DX, c+16(FP)
 	RET


 // func subVV_s(z, x, y *Word, n int) (c Word)
 // (same as addVV_s except for SBBL instead of ADCL and label names)
 TEXT ·subVV_s(SB),7,$0
 	MOVL z+0(FP), DI
 	MOVL x+4(FP), SI
 	MOVL y+8(FP), CX
 	MOVL n+12(FP), BP
 	MOVL $0, BX         // i = 0
 	MOVL $0, DX         // c = 0
 	JMP E2

 L2:	MOVL (SI)(BX*4), AX
 	RCRL $1, DX
 	SBBL (CX)(BX*4), AX
 	RCLL $1, DX
 	MOVL AX, (DI)(BX*4)
 	ADDL $1, BX         // i++

 E2:	CMPL BX, BP        // i < n
 	JL L2

 	MOVL DX, c+16(FP)
 	RET


 // func addVW_s(z, x *Word, y Word, n int) (c Word)
 TEXT ·addVW_s(SB),7,$0
 	MOVL z+0(FP), DI
 	MOVL x+4(FP), SI
 	MOVL y+8(FP), AX   // c = y
 	MOVL n+12(FP), BP
 	MOVL $0, BX         // i = 0
 	JMP E3

 L3:	ADDL (SI)(BX*4), AX
 	MOVL AX, (DI)(BX*4)
 	RCLL $1, AX
 	ANDL $1, AX
 	ADDL $1, BX         // i++

 E3:	CMPL BX, BP        // i < n
 	JL L3

 	MOVL AX, c+16(FP)
 	RET


 // func subVW_s(z, x *Word, y Word, n int) (c Word)
 TEXT ·subVW_s(SB),7,$0
 	MOVL z+0(FP), DI
 	MOVL x+4(FP), SI
 	MOVL y+8(FP), AX   // c = y
 	MOVL n+12(FP), BP
 	MOVL $0, BX         // i = 0
 	JMP E4

 L4:	MOVL (SI)(BX*4), DX	// TODO(gri) is there a reverse SUBL?
 	SUBL AX, DX
 	MOVL DX, (DI)(BX*4)
 	RCLL $1, AX
 	ANDL $1, AX
 	ADDL $1, BX          // i++

 E4:	CMPL BX, BP         // i < n
 	JL L4

 	MOVL AX, c+16(FP)
 	RET


 // func mulAddVWW_s(z, x *Word, y, r Word, n int) (c Word)
 TEXT ·mulAddVWW_s(SB),7,$0
 	MOVL z+0(FP), DI
 	MOVL x+4(FP), SI
 	MOVL y+8(FP), BP
 	MOVL r+12(FP), CX   // c = r
 	MOVL n+16(FP), BX
 	LEAL	(SI)(BX*4), SI
 	LEAL	(DI)(BX*4), DI
 	NEGL BX  // i = -n
 	JMP E5

 L5:	MOVL (SI)(BX*4), AX
 	MULL BP
 	ADDL CX, AX
 	ADCL $0, DX
 	MOVL AX, (DI)(BX*4)
 	MOVL DX, CX
 	ADDL $1, BX         // i++

 E5:	CMPL BX, $0        // i < 0
 	JL L5

 	MOVL CX, c+20(FP)
 	RET


 // func addMulVVW_s(z, x *Word, y Word, n int) (c Word)
 TEXT ·addMulVVW_s(SB),7,$0
 	MOVL z+0(FP), DI
 	MOVL x+4(FP), SI
 	MOVL y+8(FP), BP
 	MOVL n+12(FP), BX
 	LEAL	(SI)(BX*4), SI
 	LEAL	(DI)(BX*4), DI
 	NEGL BX  // i = -n
 	MOVL $0, CX         // c = 0
 	JMP E6

 L6:	MOVL (SI)(BX*4), AX
 	MULL BP
 	ADDL (DI)(BX*4), AX
 	ADCL $0, DX
 	ADDL CX, AX
 	ADCL $0, DX
 	MOVL AX, (DI)(BX*4)
 	MOVL DX, CX
 	ADDL $1, BX         // i++

 E6:	CMPL BX, $0        // i < 0
 	JL L6

 	MOVL CX, c+16(FP)
 	RET


 // divWVW_s(z* Word, xn Word, x *Word, y Word, n int) (r Word)
 TEXT ·divWVW_s(SB),7,$0
 	MOVL z+0(FP), DI
 	MOVL xn+4(FP), DX   // r = xn
 	MOVL x+8(FP), SI
 	MOVL y+12(FP), CX
 	MOVL n+16(FP), BX   // i = n
 	JMP E7

 L7:	MOVL (SI)(BX*4), AX
 	DIVL CX
 	MOVL AX, (DI)(BX*4)

 E7:	SUBL $1, BX         // i--
 	JGE L7              // i >= 0

 	MOVL DX, r+20(FP)
 	RET
	// Copyright 2009 The Go Authors. All rights reserved.
	// Use of this source code is governed by a BSD-style
	// license that can be found in the LICENSE file.

	// This file provides fast assembly versions for the elementary
	// arithmetic operations on vectors implemented in arith.go.

	// func addVV_s(z, x, y *Word, n int) (c Word)
	TEXT ·addVV_s(SB),7,$0
	MOVL z+0(FP), DI
	MOVL x+4(FP), SI
	MOVL y+8(FP), CX
	MOVL n+12(FP), BP
	MOVL $0, BX // i = 0
	MOVL $0, DX // c = 0
	JMP E1

	L1: MOVL (SI)(BX*4), AX
	RCRL $1, DX
	ADCL (CX)(BX*4), AX
	RCLL $1, DX
	MOVL AX, (DI)(BX*4)
	ADDL $1, BX // i++

	E1: CMPL BX, BP // i < n
	JL L1

	MOVL DX, c+16(FP)
	RET


	// func subVV_s(z, x, y *Word, n int) (c Word)
	// (same as addVV_s except for SBBL instead of ADCL and label names)
	TEXT ·subVV_s(SB),7,$0
	MOVL z+0(FP), DI
	MOVL x+4(FP), SI
	MOVL y+8(FP), CX
	MOVL n+12(FP), BP
	MOVL $0, BX // i = 0
	MOVL $0, DX // c = 0
	JMP E2

	L2: MOVL (SI)(BX*4), AX
	RCRL $1, DX
	SBBL (CX)(BX*4), AX
	RCLL $1, DX
	MOVL AX, (DI)(BX*4)
	ADDL $1, BX // i++

	E2: CMPL BX, BP // i < n
	JL L2

	MOVL DX, c+16(FP)
	RET


	// func addVW_s(z, x *Word, y Word, n int) (c Word)
	TEXT ·addVW_s(SB),7,$0
	MOVL z+0(FP), DI
	MOVL x+4(FP), SI
	MOVL y+8(FP), AX // c = y
	MOVL n+12(FP), BP
	MOVL $0, BX // i = 0
	JMP E3

	L3: ADDL (SI)(BX*4), AX
	MOVL AX, (DI)(BX*4)
	RCLL $1, AX
	ANDL $1, AX
	ADDL $1, BX // i++

	E3: CMPL BX, BP // i < n
	JL L3

	MOVL AX, c+16(FP)
	RET


	// func subVW_s(z, x *Word, y Word, n int) (c Word)
	TEXT ·subVW_s(SB),7,$0
	MOVL z+0(FP), DI
	MOVL x+4(FP), SI
	MOVL y+8(FP), AX // c = y
	MOVL n+12(FP), BP
	MOVL $0, BX // i = 0
	JMP E4

	L4: MOVL (SI)(BX*4), DX // TODO(gri) is there a reverse SUBL?
	SUBL AX, DX
	MOVL DX, (DI)(BX*4)
	RCLL $1, AX
	ANDL $1, AX
	ADDL $1, BX // i++

	E4: CMPL BX, BP // i < n
	JL L4

	MOVL AX, c+16(FP)
	RET


	// func mulAddVWW_s(z, x *Word, y, r Word, n int) (c Word)
	TEXT ·mulAddVWW_s(SB),7,$0
	MOVL z+0(FP), DI
	MOVL x+4(FP), SI
	MOVL y+8(FP), BP
	MOVL r+12(FP), CX // c = r
	MOVL n+16(FP), BX
	LEAL (SI)(BX*4), SI
	LEAL (DI)(BX*4), DI
	NEGL BX // i = -n
	JMP E5

	L5: MOVL (SI)(BX*4), AX
	MULL BP
	ADDL CX, AX
	ADCL $0, DX
	MOVL AX, (DI)(BX*4)
	MOVL DX, CX
	ADDL $1, BX // i++

	E5: CMPL BX, $0 // i < 0
	JL L5

	MOVL CX, c+20(FP)
	RET


	// func addMulVVW_s(z, x *Word, y Word, n int) (c Word)
	TEXT ·addMulVVW_s(SB),7,$0
	MOVL z+0(FP), DI
	MOVL x+4(FP), SI
	MOVL y+8(FP), BP
	MOVL n+12(FP), BX
	LEAL (SI)(BX*4), SI
	LEAL (DI)(BX*4), DI
	NEGL BX // i = -n
	MOVL $0, CX // c = 0
	JMP E6

	L6: MOVL (SI)(BX*4), AX
	MULL BP
	ADDL (DI)(BX*4), AX
	ADCL $0, DX
	ADDL CX, AX
	ADCL $0, DX
	MOVL AX, (DI)(BX*4)
	MOVL DX, CX
	ADDL $1, BX // i++

	E6: CMPL BX, $0 // i < 0
	JL L6

	MOVL CX, c+16(FP)
	RET


	// divWVW_s(z* Word, xn Word, x *Word, y Word, n int) (r Word)
	TEXT ·divWVW_s(SB),7,$0
	MOVL z+0(FP), DI
	MOVL xn+4(FP), DX // r = xn
	MOVL x+8(FP), SI
	MOVL y+12(FP), CX
	MOVL n+16(FP), BX // i = n
	JMP E7

	L7: MOVL (SI)(BX*4), AX
	DIVL CX
	MOVL AX, (DI)(BX*4)

	E7: SUBL $1, BX // i--
	JGE L7 // i >= 0

	MOVL DX, r+20(FP)
	RET