src/cmd/asm/internal/asm/parse.go - go - Git at Google

 // Copyright 2015 The Go Authors. All rights reserved.
 // Use of this source code is governed by a BSD-style
 // license that can be found in the LICENSE file.

 // Package asm implements the parser and instruction generator for the assembler.
 // TODO: Split apart?
 package asm

 import (
 	"fmt"
 	"log"
 	"os"
 	"strconv"
 	"text/scanner"
 	"unicode/utf8"

 	"cmd/asm/internal/arch"
 	"cmd/asm/internal/lex"
 	"cmd/internal/obj"
 )

 type Parser struct {
 	lex           lex.TokenReader
 	lineNum       int   // Line number in source file.
 	histLineNum   int32 // Cumulative line number across source files.
 	errorLine     int32 // (Cumulative) line number of last error.
 	errorCount    int   // Number of errors.
 	pc            int64 // virtual PC; count of Progs; doesn't advance for GLOBL or DATA.
 	input         []lex.Token
 	inputPos      int
 	pendingLabels []string // Labels to attach to next instruction.
 	labels        map[string]*obj.Prog
 	toPatch       []Patch
 	addr          []obj.Addr
 	arch          *arch.Arch
 	ctxt          *obj.Link
 	firstProg     *obj.Prog
 	lastProg      *obj.Prog
 	dataAddr      map[string]int64 // Most recent address for DATA for this symbol.
 }

 type Patch struct {
 	prog  *obj.Prog
 	label string
 }

 func NewParser(ctxt *obj.Link, ar *arch.Arch, lexer lex.TokenReader) *Parser {
 	return &Parser{
 		ctxt:     ctxt,
 		arch:     ar,
 		lex:      lexer,
 		labels:   make(map[string]*obj.Prog),
 		dataAddr: make(map[string]int64),
 	}
 }

 func (p *Parser) errorf(format string, args ...interface{}) {
 	if p.histLineNum == p.errorLine {
 		// Only one error per line.
 		return
 	}
 	p.errorLine = p.histLineNum
 	// Put file and line information on head of message.
 	format = "%s:%d: " + format + "\n"
 	args = append([]interface{}{p.lex.File(), p.lineNum}, args...)
 	fmt.Fprintf(os.Stderr, format, args...)
 	p.errorCount++
 	if p.errorCount > 10 {
 		log.Fatal("too many errors")
 	}
 }

 func (p *Parser) Parse() (*obj.Prog, bool) {
 	for p.line() {
 	}
 	if p.errorCount > 0 {
 		return nil, false
 	}
 	p.patch()
 	return p.firstProg, true
 }

 // WORD [ arg {, arg} ] (';' | '\n')
 func (p *Parser) line() bool {
 	// Skip newlines.
 	var tok lex.ScanToken
 	for {
 		tok = p.lex.Next()
 		// We save the line number here so error messages from this instruction
 		// are labeled with this line. Otherwise we complain after we've absorbed
 		// the terminating newline and the line numbers are off by one in errors.
 		p.lineNum = p.lex.Line()
 		p.histLineNum = lex.HistLine()
 		switch tok {
 		case '\n', ';':
 			continue
 		case scanner.EOF:
 			return false
 		}
 		break
 	}
 	// First item must be an identifier.
 	if tok != scanner.Ident {
 		p.errorf("expected identifier, found %q", p.lex.Text())
 		return false // Might as well stop now.
 	}
 	word := p.lex.Text()
 	var cond string
 	operands := make([][]lex.Token, 0, 3)
 	// Zero or more comma-separated operands, one per loop.
 	nesting := 0
 	for tok != '\n' && tok != ';' {
 		// Process one operand.
 		items := make([]lex.Token, 0, 3)
 		for {
 			tok = p.lex.Next()
 			if len(operands) == 0 && len(items) == 0 {
 				if p.arch.Thechar == '5' && tok == '.' {
 					// ARM conditionals.
 					tok = p.lex.Next()
 					str := p.lex.Text()
 					if tok != scanner.Ident {
 						p.errorf("ARM condition expected identifier, found %s", str)
 					}
 					cond = cond + "." + str
 					continue
 				}
 				if tok == ':' {
 					// Labels.
 					p.pendingLabels = append(p.pendingLabels, word)
 					return true
 				}
 			}
 			if tok == scanner.EOF {
 				p.errorf("unexpected EOF")
 				return false
 			}
 			if tok == '\n' || tok == ';' || (nesting == 0 && tok == ',') {
 				break
 			}
 			if tok == '(' || tok == '[' {
 				nesting++
 			}
 			if tok == ')' || tok == ']' {
 				nesting--
 			}
 			items = append(items, lex.Make(tok, p.lex.Text()))
 		}
 		if len(items) > 0 {
 			operands = append(operands, items)
 		} else if len(operands) > 0 || tok == ',' {
 			// Had a comma with nothing after.
 			p.errorf("missing operand")
 		}
 	}
 	i, present := arch.Pseudos[word]
 	if present {
 		p.pseudo(i, word, operands)
 		return true
 	}
 	i, present = p.arch.Instructions[word]
 	if present {
 		p.instruction(i, word, cond, operands)
 		return true
 	}
 	p.errorf("unrecognized instruction %q", word)
 	return true
 }

 func (p *Parser) instruction(op int, word, cond string, operands [][]lex.Token) {
 	p.addr = p.addr[0:0]
 	isJump := p.arch.IsJump(word)
 	for _, op := range operands {
 		addr := p.address(op)
 		if !isJump && addr.Reg < 0 { // Jumps refer to PC, a pseudo.
 			p.errorf("illegal use of pseudo-register in %s", word)
 		}
 		p.addr = append(p.addr, addr)
 	}
 	if isJump {
 		p.asmJump(op, cond, p.addr)
 		return
 	}
 	p.asmInstruction(op, cond, p.addr)
 }

 func (p *Parser) pseudo(op int, word string, operands [][]lex.Token) {
 	switch op {
 	case obj.ATEXT:
 		p.asmText(word, operands)
 	case obj.ADATA:
 		p.asmData(word, operands)
 	case obj.AGLOBL:
 		p.asmGlobl(word, operands)
 	case obj.APCDATA:
 		p.asmPCData(word, operands)
 	case obj.AFUNCDATA:
 		p.asmFuncData(word, operands)
 	default:
 		p.errorf("unimplemented: %s", word)
 	}
 }

 func (p *Parser) start(operand []lex.Token) {
 	p.input = operand
 	p.inputPos = 0
 }

 // address parses the operand into a link address structure.
 func (p *Parser) address(operand []lex.Token) obj.Addr {
 	p.start(operand)
 	addr := obj.Addr{}
 	p.operand(&addr)
 	return addr
 }

 // parseScale converts a decimal string into a valid scale factor.
 func (p *Parser) parseScale(s string) int8 {
 	switch s {
 	case "1", "2", "4", "8":
 		return int8(s[0] - '0')
 	}
 	p.errorf("bad scale: %s", s)
 	return 0
 }

 // operand parses a general operand and stores the result in *a.
 func (p *Parser) operand(a *obj.Addr) bool {
 	// fmt.Printf("Operand: %v\n", p.input)
 	if len(p.input) == 0 {
 		p.errorf("empty operand: cannot happen")
 		return false
 	}
 	// General address (with a few exceptions) looks like
 	//	$sym±offset(SB)(reg)(index*scale)
 	// Exceptions are:
 	//
 	//	R1
 	//	offset
 	//	$offset
 	// Every piece is optional, so we scan left to right and what
 	// we discover tells us where we are.

 	// Prefix: $.
 	var prefix rune
 	switch tok := p.peek(); tok {
 	case '$', '*':
 		prefix = rune(tok)
 		p.next()
 	}

 	// Symbol: sym±offset(SB)
 	tok := p.next()
 	name := tok.String()
 	if tok.ScanToken == scanner.Ident && !p.atStartOfRegister(name) {
 		// We have a symbol. Parse $sym±offset(symkind)
 		p.symbolReference(a, name, prefix)
 		// fmt.Printf("SYM %s\n", obj.Dconv(&emptyProg, 0, a))
 		if p.peek() == scanner.EOF {
 			return true
 		}
 	}

 	// Special register list syntax for arm: [R1,R3-R7]
 	if tok.ScanToken == '[' {
 		if prefix != 0 {
 			p.errorf("illegal use of register list")
 		}
 		p.registerList(a)
 		p.expect(scanner.EOF)
 		return true
 	}

 	// Register: R1
 	if tok.ScanToken == scanner.Ident && p.atStartOfRegister(name) {
 		if p.atRegisterShift() {
 			// ARM shifted register such as R1<<R2 or R1>>2.
 			a.Type = obj.TYPE_SHIFT
 			a.Offset = p.registerShift(tok.String(), prefix)
 			if p.peek() == '(' {
 				// Can only be a literal register here.
 				p.next()
 				tok := p.next()
 				name := tok.String()
 				if !p.atStartOfRegister(name) {
 					p.errorf("expected register; found %s", name)
 				}
 				a.Reg, _ = p.registerReference(name)
 				p.get(')')
 			}
 		} else if r1, r2, scale, ok := p.register(tok.String(), prefix); ok {
 			if scale != 0 {
 				p.errorf("expected simple register reference")
 			}
 			a.Type = obj.TYPE_REG
 			a.Reg = r1
 			if r2 != 0 {
 				// Form is R1:R2. It is on RHS and the second register
 				// needs to go into the LHS. This is a horrible hack. TODO.
 				a.Reg2 = r2
 			}
 		}
 		// fmt.Printf("REG %s\n", obj.Dconv(&emptyProg, 0, a))
 		p.expect(scanner.EOF)
 		return true
 	}

 	// Constant.
 	haveConstant := false
 	switch tok.ScanToken {
 	case scanner.Int, scanner.Float, scanner.String, scanner.Char, '+', '-', '~':
 		haveConstant = true
 	case '(':
 		// Could be parenthesized expression or (R).
 		rname := p.next().String()
 		p.back()
 		haveConstant = !p.atStartOfRegister(rname)
 		if !haveConstant {
 			p.back() // Put back the '('.
 		}
 	}
 	if haveConstant {
 		p.back()
 		if p.have(scanner.Float) {
 			if prefix != '$' {
 				p.errorf("floating-point constant must be an immediate")
 			}
 			a.Type = obj.TYPE_FCONST
 			a.U.Dval = p.floatExpr()
 			// fmt.Printf("FCONST %s\n", obj.Dconv(&emptyProg, 0, a))
 			p.expect(scanner.EOF)
 			return true
 		}
 		if p.have(scanner.String) {
 			if prefix != '$' {
 				p.errorf("string constant must be an immediate")
 			}
 			str, err := strconv.Unquote(p.get(scanner.String).String())
 			if err != nil {
 				p.errorf("string parse error: %s", err)
 			}
 			a.Type = obj.TYPE_SCONST
 			a.U.Sval = str
 			// fmt.Printf("SCONST %s\n", obj.Dconv(&emptyProg, 0, a))
 			p.expect(scanner.EOF)
 			return true
 		}
 		a.Offset = int64(p.expr())
 		if p.peek() != '(' {
 			switch prefix {
 			case '$':
 				a.Type = obj.TYPE_CONST
 			case '*':
 				a.Type = obj.TYPE_INDIR // Can appear but is illegal, will be rejected by the linker.
 			default:
 				a.Type = obj.TYPE_MEM
 			}
 			// fmt.Printf("CONST %d %s\n", a.Offset, obj.Dconv(&emptyProg, 0, a))
 			p.expect(scanner.EOF)
 			return true
 		}
 		// fmt.Printf("offset %d \n", a.Offset)
 	}

 	// Odd x86 case: sym+4(SB):AX. Have name, colon, register.
 	if p.peek() == ':' && a.Name != obj.NAME_NONE && a.Reg2 == 0 && (p.arch.Thechar == '6' || p.arch.Thechar == '8') {
 		p.get(':')
 		r2, ok := p.registerReference(p.next().String())
 		if !ok {
 			return false
 		}
 		a.Reg2 = r2 // TODO: See comment about Reg3 above.
 	} else {
 		// Register indirection: (reg) or (index*scale). We are on the opening paren.
 		p.registerIndirect(a, prefix)
 	}
 	// fmt.Printf("DONE %s\n", p.arch.Dconv(&emptyProg, 0, a))

 	p.expect(scanner.EOF)
 	return true
 }

 // atStartOfRegister reports whether the parser is at the start of a register definition.
 func (p *Parser) atStartOfRegister(name string) bool {
 	// Simple register: R10.
 	_, present := p.arch.Register[name]
 	if present {
 		return true
 	}
 	// Parenthesized register: R(10).
 	return p.arch.RegisterPrefix[name] && p.peek() == '('
 }

 // atRegisterShift reports whether we are at the start of an ARM shifted register.
 // We have consumed the register or R prefix.
 func (p *Parser) atRegisterShift() bool {
 	// ARM only.
 	if p.arch.Thechar != '5' {
 		return false
 	}
 	// R1<<...
 	if lex.IsRegisterShift(p.peek()) {
 		return true
 	}
 	// R(1)<<...   Ugly check. TODO: Rethink how we handle ARM register shifts to be
 	// less special.
 	if p.peek() != '(' || len(p.input)-p.inputPos < 4 {
 		return false
 	}
 	return p.at('(', scanner.Int, ')') && lex.IsRegisterShift(p.input[p.inputPos+3].ScanToken)
 }

 // registerReference parses a register given either the name, R10, or a parenthesized form, SPR(10).
 func (p *Parser) registerReference(name string) (int16, bool) {
 	r, present := p.arch.Register[name]
 	if present {
 		return r, true
 	}
 	if !p.arch.RegisterPrefix[name] {
 		p.errorf("expected register; found %s", name)
 		return 0, false
 	}
 	p.get('(')
 	tok := p.get(scanner.Int)
 	num, err := strconv.ParseInt(tok.String(), 10, 16)
 	p.get(')')
 	if err != nil {
 		p.errorf("parsing register list: %s", err)
 		return 0, false
 	}
 	r, ok := p.arch.RegisterNumber(name, int16(num))
 	if !ok {
 		p.errorf("illegal register %s(%d)", name, r)
 		return 0, false
 	}
 	return r, true
 }

 // register parses a full register reference where there is no symbol present (as in 4(R0) or R(10) but not sym(SB))
 // including forms involving multiple registers such as R1:R2.
 func (p *Parser) register(name string, prefix rune) (r1, r2 int16, scale int8, ok bool) {
 	// R1 or R(1) R1:R2 R1,R2 R1+R2, or R1*scale.
 	r1, ok = p.registerReference(name)
 	if !ok {
 		return
 	}
 	if prefix != 0 && prefix != '*' { // *AX is OK.
 		p.errorf("prefix %c not allowed for register: %c%s", prefix, prefix, name)
 	}
 	c := p.peek()
 	if c == ':' || c == ',' || c == '+' {
 		// 2nd register; syntax (R1:R2) etc. No two architectures agree.
 		// Check the architectures match the syntax.
 		char := p.arch.Thechar
 		switch p.next().ScanToken {
 		case ':':
 			if char != '6' && char != '8' {
 				p.errorf("illegal register pair syntax")
 				return
 			}
 		case ',':
 			if char != '5' {
 				p.errorf("illegal register pair syntax")
 				return
 			}
 		case '+':
 			if char != '9' {
 				p.errorf("illegal register pair syntax")
 				return
 			}
 		}
 		name := p.next().String()
 		r2, ok = p.registerReference(name)
 		if !ok {
 			return
 		}
 	}
 	if p.peek() == '*' {
 		// Scale
 		p.next()
 		scale = p.parseScale(p.next().String())
 	}
 	return r1, r2, scale, true
 }

 // registerShift parses an ARM shifted register reference and returns the encoded representation.
 // There is known to be a register (current token) and a shift operator (peeked token).
 func (p *Parser) registerShift(name string, prefix rune) int64 {
 	if prefix != 0 {
 		p.errorf("prefix %c not allowed for shifted register: $%s", prefix, name)
 	}
 	// R1 op R2 or r1 op constant.
 	// op is:
 	//	"<<" == 0
 	//	">>" == 1
 	//	"->" == 2
 	//	"@>" == 3
 	r1, ok := p.registerReference(name)
 	if !ok {
 		return 0
 	}
 	var op int16
 	switch p.next().ScanToken {
 	case lex.LSH:
 		op = 0
 	case lex.RSH:
 		op = 1
 	case lex.ARR:
 		op = 2
 	case lex.ROT:
 		op = 3
 	}
 	tok := p.next()
 	str := tok.String()
 	var count int16
 	switch tok.ScanToken {
 	case scanner.Ident:
 		r2, ok := p.registerReference(str)
 		if !ok {
 			p.errorf("rhs of shift must be register or integer: %s", str)
 		}
 		count = (r2&15)<<8 | 1<<4
 	case scanner.Int, '(':
 		p.back()
 		x := int64(p.expr())
 		if x >= 32 {
 			p.errorf("register shift count too large: %s", str)
 		}
 		count = int16((x & 31) << 7)
 	default:
 		p.errorf("unexpected %s in register shift", tok.String())
 	}
 	return int64((r1 & 15) | op<<5 | count)
 }

 // symbolReference parses a symbol that is known not to be a register.
 func (p *Parser) symbolReference(a *obj.Addr, name string, prefix rune) {
 	// Identifier is a name.
 	switch prefix {
 	case 0:
 		a.Type = obj.TYPE_MEM
 	case '$':
 		a.Type = obj.TYPE_ADDR
 	case '*':
 		a.Type = obj.TYPE_INDIR
 	}
 	// Weirdness with statics: Might now have "<>".
 	isStatic := 0 // TODO: Really a boolean, but Linklookup wants a "version" integer.
 	if p.peek() == '<' {
 		isStatic = 1
 		p.next()
 		p.get('>')
 	}
 	if p.peek() == '+' || p.peek() == '-' {
 		a.Offset = int64(p.expr())
 	}
 	a.Sym = obj.Linklookup(p.ctxt, name, isStatic)
 	if p.peek() == scanner.EOF {
 		if prefix != 0 {
 			p.errorf("illegal addressing mode for symbol %s", name)
 		}
 		return
 	}
 	// Expect (SB) or (FP), (PC), (SB), or (SP)
 	p.get('(')
 	reg := p.get(scanner.Ident).String()
 	p.get(')')
 	p.setPseudoRegister(a, reg, isStatic != 0, prefix)
 }

 // setPseudoRegister sets the NAME field of addr for a pseudo-register reference such as (SB).
 func (p *Parser) setPseudoRegister(addr *obj.Addr, reg string, isStatic bool, prefix rune) {
 	if addr.Reg != 0 {
 		p.errorf("internal error: reg %s already set in pseudo", reg)
 	}
 	switch reg {
 	case "FP":
 		addr.Name = obj.NAME_PARAM
 	case "PC":
 		if prefix != 0 {
 			p.errorf("illegal addressing mode for PC")
 		}
 		addr.Type = obj.TYPE_BRANCH // We set the type and leave NAME untouched. See asmJump.
 	case "SB":
 		addr.Name = obj.NAME_EXTERN
 		if isStatic {
 			addr.Name = obj.NAME_STATIC
 		}
 	case "SP":
 		addr.Name = obj.NAME_AUTO // The pseudo-stack.
 	default:
 		p.errorf("expected pseudo-register; found %s", reg)
 	}
 	if prefix == '$' {
 		addr.Type = obj.TYPE_ADDR
 	}
 }

 // registerIndirect parses the general form of a register indirection.
 // It is can be (R1), (R2*scale), or (R1)(R2*scale) where R1 may be a simple
 // register or register pair R:R or (R, R).
 // Or it might be a pseudo-indirection like (FP).
 // We are sitting on the opening parenthesis.
 func (p *Parser) registerIndirect(a *obj.Addr, prefix rune) {
 	p.get('(')
 	tok := p.next()
 	name := tok.String()
 	r1, r2, scale, ok := p.register(name, 0)
 	if !ok {
 		p.errorf("indirect through non-register %s", tok)
 	}
 	p.get(')')
 	a.Type = obj.TYPE_MEM
 	if r1 < 0 {
 		// Pseudo-register reference.
 		if r2 != 0 {
 			p.errorf("cannot use pseudo-register in pair")
 			return
 		}
 		// For SB, SP, and FP, there must be a name here. 0(FP) is not legal.
 		if name != "PC" && a.Name == obj.NAME_NONE {
 			p.errorf("cannot reference %s without a symbol", name)
 		}
 		p.setPseudoRegister(a, name, false, prefix)
 		return
 	}
 	a.Reg = r1
 	if r2 != 0 {
 		// TODO: Consistency in the encoding would be nice here.
 		if p.arch.Thechar == '5' {
 			// Special form for ARM: destination register pair (R1, R2).
 			if prefix != 0 || scale != 0 {
 				p.errorf("illegal address mode for register pair")
 				return
 			}
 			a.Type = obj.TYPE_REGREG
 			a.Offset = int64(r2)
 			// Nothing may follow; this is always a pure destination.
 			return
 		}
 		if p.arch.Thechar == '9' {
 			// Special form for PPC64: register pair (R1+R2).
 			if prefix != 0 || scale != 0 {
 				p.errorf("illegal address mode for register pair")
 				return
 			}
 			// TODO: This is rewritten in asm. Clumsy.
 			a.Type = obj.TYPE_MEM
 			a.Scale = r2
 			// Nothing may follow.
 			return
 		}
 	}
 	if r2 != 0 {
 		p.errorf("indirect through register pair")
 	}
 	if prefix == '$' {
 		a.Type = obj.TYPE_ADDR
 	}
 	if r1 == arch.RPC && prefix != 0 {
 		p.errorf("illegal addressing mode for PC")
 	}
 	if scale == 0 && p.peek() == '(' {
 		// General form (R)(R*scale).
 		p.next()
 		tok := p.next()
 		r1, r2, scale, ok = p.register(tok.String(), 0)
 		if !ok {
 			p.errorf("indirect through non-register %s", tok)
 		}
 		if r2 != 0 {
 			p.errorf("unimplemented two-register form")
 		}
 		a.Index = r1
 		a.Scale = int16(scale)
 		p.get(')')
 	} else if scale != 0 {
 		// First (R) was missing, all we have is (R*scale).
 		a.Reg = 0
 		a.Index = r1
 		a.Scale = int16(scale)
 	}
 }

 // registerList parses an ARM register list expression, a list of registers in [].
 // There may be comma-separated ranges or individual registers, as in
 // [R1,R3-R5]. Only R0 through R15 may appear.
 // The opening bracket has been consumed.
 func (p *Parser) registerList(a *obj.Addr) {
 	// One range per loop.
 	var bits uint16
 	for {
 		tok := p.next()
 		if tok.ScanToken == ']' {
 			break
 		}
 		lo := p.registerNumber(tok.String())
 		hi := lo
 		if p.peek() == '-' {
 			p.next()
 			hi = p.registerNumber(p.next().String())
 		}
 		if hi < lo {
 			lo, hi = hi, lo
 		}
 		for lo <= hi {
 			if bits&(1<<lo) != 0 {
 				p.errorf("register R%d already in list", lo)
 			}
 			bits |= 1 << lo
 			lo++
 		}
 		if p.peek() != ']' {
 			p.get(',')
 		}
 	}
 	a.Type = obj.TYPE_REGLIST
 	a.Offset = int64(bits)
 }

 // register number is ARM-specific. It returns the number of the specified register.
 func (p *Parser) registerNumber(name string) uint16 {
 	if p.arch.Thechar == '5' && name == "g" {
 		return 10
 	}
 	if name[0] != 'R' {
 		p.errorf("expected g or R0 through R15; found %s", name)
 	}
 	r, ok := p.registerReference(name)
 	if !ok {
 		return 0
 	}
 	return uint16(r - p.arch.Register["R0"])
 }

 // Note: There are two changes in the expression handling here
 // compared to the old yacc/C implemenatations. Neither has
 // much practical consequence because the expressions we
 // see in assembly code are simple, but for the record:
 //
 // 1) Evaluation uses uint64; the old one used int64.
 // 2) Precedence uses Go rules not C rules.

 // expr = term | term ('+' | '-' | '|' | '^') term.
 func (p *Parser) expr() uint64 {
 	value := p.term()
 	for {
 		switch p.peek() {
 		case '+':
 			p.next()
 			value += p.term()
 		case '-':
 			p.next()
 			value -= p.term()
 		case '|':
 			p.next()
 			value |= p.term()
 		case '^':
 			p.next()
 			value ^= p.term()
 		default:
 			return value
 		}
 	}
 }

 // floatExpr = fconst | '-' floatExpr | '+' floatExpr | '(' floatExpr ')'
 func (p *Parser) floatExpr() float64 {
 	tok := p.next()
 	switch tok.ScanToken {
 	case '(':
 		v := p.floatExpr()
 		if p.next().ScanToken != ')' {
 			p.errorf("missing closing paren")
 		}
 		return v
 	case '+':
 		return +p.floatExpr()
 	case '-':
 		return -p.floatExpr()
 	case scanner.Float:
 		return p.atof(tok.String())
 	}
 	p.errorf("unexpected %s evaluating float expression", tok)
 	return 0
 }

 // term = factor | factor ('*' | '/' | '%' | '>>' | '<<' | '&') factor
 func (p *Parser) term() uint64 {
 	value := p.factor()
 	for {
 		switch p.peek() {
 		case '*':
 			p.next()
 			value *= p.factor()
 		case '/':
 			p.next()
 			if value&(1<<63) != 0 {
 				p.errorf("divide with high bit set")
 			}
 			value /= p.factor()
 		case '%':
 			p.next()
 			value %= p.factor()
 		case lex.LSH:
 			p.next()
 			shift := p.factor()
 			if int64(shift) < 0 {
 				p.errorf("negative left shift %d", shift)
 			}
 			return value << shift
 		case lex.RSH:
 			p.next()
 			shift := p.term()
 			if shift < 0 {
 				p.errorf("negative right shift %d", shift)
 			}
 			if shift > 0 && value&(1<<63) != 0 {
 				p.errorf("right shift with high bit set")
 			}
 			value >>= uint(shift)
 		case '&':
 			p.next()
 			value &= p.factor()
 		default:
 			return value
 		}
 	}
 }

 // factor = const | '+' factor | '-' factor | '~' factor | '(' expr ')'
 func (p *Parser) factor() uint64 {
 	tok := p.next()
 	switch tok.ScanToken {
 	case scanner.Int:
 		return p.atoi(tok.String())
 	case scanner.Char:
 		str, err := strconv.Unquote(tok.String())
 		if err != nil {
 			p.errorf("%s", err)
 		}
 		r, w := utf8.DecodeRuneInString(str)
 		if w == 1 && r == utf8.RuneError {
 			p.errorf("illegal UTF-8 encoding for character constant")
 		}
 		return uint64(r)
 	case '+':
 		return +p.factor()
 	case '-':
 		return -p.factor()
 	case '~':
 		return ^p.factor()
 	case '(':
 		v := p.expr()
 		if p.next().ScanToken != ')' {
 			p.errorf("missing closing paren")
 		}
 		return v
 	}
 	p.errorf("unexpected %s evaluating expression", tok)
 	return 0
 }

 // positiveAtoi returns an int64 that must be >= 0.
 func (p *Parser) positiveAtoi(str string) int64 {
 	value, err := strconv.ParseInt(str, 0, 64)
 	if err != nil {
 		p.errorf("%s", err)
 	}
 	if value < 0 {
 		p.errorf("%s overflows int64", str)
 	}
 	return value
 }

 func (p *Parser) atoi(str string) uint64 {
 	value, err := strconv.ParseUint(str, 0, 64)
 	if err != nil {
 		p.errorf("%s", err)
 	}
 	return value
 }

 func (p *Parser) atof(str string) float64 {
 	value, err := strconv.ParseFloat(str, 64)
 	if err != nil {
 		p.errorf("%s", err)
 	}
 	return value
 }

 func (p *Parser) atos(str string) string {
 	value, err := strconv.Unquote(str)
 	if err != nil {
 		p.errorf("%s", err)
 	}
 	return value
 }

 // EOF represents the end of input.
 var EOF = lex.Make(scanner.EOF, "EOF")

 func (p *Parser) next() lex.Token {
 	if !p.more() {
 		return EOF
 	}
 	tok := p.input[p.inputPos]
 	p.inputPos++
 	return tok
 }

 func (p *Parser) back() {
 	p.inputPos--
 }

 func (p *Parser) peek() lex.ScanToken {
 	if p.more() {
 		return p.input[p.inputPos].ScanToken
 	}
 	return scanner.EOF
 }

 func (p *Parser) more() bool {
 	return p.inputPos < len(p.input)
 }

 // get verifies that the next item has the expected type and returns it.
 func (p *Parser) get(expected lex.ScanToken) lex.Token {
 	p.expect(expected)
 	return p.next()
 }

 // expect verifies that the next item has the expected type. It does not consume it.
 func (p *Parser) expect(expected lex.ScanToken) {
 	if p.peek() != expected {
 		p.errorf("expected %s, found %s", expected, p.next())
 	}
 }

 // have reports whether the remaining tokens (including the current one) contain the specified token.
 func (p *Parser) have(token lex.ScanToken) bool {
 	for i := p.inputPos; i < len(p.input); i++ {
 		if p.input[i].ScanToken == token {
 			return true
 		}
 	}
 	return false
 }

 // at reports whether the next tokens are as requested.
 func (p *Parser) at(next ...lex.ScanToken) bool {
 	if len(p.input)-p.inputPos < len(next) {
 		return false
 	}
 	for i, r := range next {
 		if p.input[p.inputPos+i].ScanToken != r {
 			return false
 		}
 	}
 	return true
 }